๋น ๋ฅธ ์์ ๊ฐ์ด๋
5๋ถ ์์ ์์ํ๊ธฐ
1๋จ๊ณ: ์ค์น (1๋ถ)
setup.bat
2๋จ๊ณ: ํ๊น ํ์ด์ค ํ ํฐ ์ค์ (2๋ถ)
"New token" โ ์ด๋ฆ:
party-crawlerโ ๊ถํ: Write โ ์์ฑ ํ ๋ณต์ฌ.envํ์ผ์ ๋ฉ๋ชจ์ฅ์ผ๋ก ์ด๊ณ ์ ๋ ฅ:
HF_TOKEN=์ฌ๊ธฐ์_๋ณต์ฌํ_ํ ํฐ_๋ถ์ฌ๋ฃ๊ธฐ
HF_REPO_ID=your_username/minjoo-press-releases
HF_REPO_ID_PPP=your_username/ppp-press-releases
HF_REPO_ID_REBUILDING=your_username/rebuilding-press-releases
HF_REPO_ID_REFORM=your_username/reform-press-releases
HF_REPO_ID_BASIC_INCOME=your_username/basic-income-press-releases
HF_REPO_ID_JINBO=your_username/jinbo-press-releases
์ค์:
your_username์ ์ค์ ํ๊น ํ์ด์ค ์ฌ์ฉ์๋ช ์ผ๋ก ๋ณ๊ฒฝํ์ธ์!
3๋จ๊ณ: ์คํ (2๋ถ)
์ ์ฒด ์ ๋น ํ ๋ฒ์ ์์ง (์ถ์ฒ)
python main.py
ํน์ ์ ๋น๋ง ์์ง
python main.py --party minjoo # ๋๋ถ์ด๋ฏผ์ฃผ๋น
python main.py --party ppp # ๊ตญ๋ฏผ์ํ
python main.py --party rebuilding # ์กฐ๊ตญํ์ ๋น
python main.py --party reform # ๊ฐํ์ ๋น
python main.py --party basic_income # ๊ธฐ๋ณธ์๋๋น
python main.py --party jinbo # ์ง๋ณด๋น
๋ ์ง ๋ฒ์ ์ง์
python main.py --start-date 2024-01-01
python main.py --party reform --start-date 2024-01-01 --end-date 2024-06-30
์๋ฃ!
๋ฐ์ดํฐ ์ ์ฅ ์์น:
- ๋ก์ปฌ:
./data/ํด๋ (CSV, Excel) - ํ๊น ํ์ด์ค: ๊ฐ ์ ๋น๋ณ ์ ์ฅ์์ ์๋ ์ ๋ก๋
์ ์ฒด ์ต์ ์์ฝ
| ๋ช ๋ น์ด | ์ค๋ช |
|---|---|
python main.py |
6๊ฐ ์ ๋น ์ ์ฒด ์ฆ๋ถ ์ ๋ฐ์ดํธ |
python main.py --party [์ฝ๋] |
ํน์ ์ ๋น๋ง |
python main.py --start-date YYYY-MM-DD |
์์ ๋ ์ง ์ง์ |
python unified_scheduler.py |
๋งค์ผ ์๋ ์คํ (์ค์ผ์ค๋ฌ) |
์ ๋น ์ฝ๋ ๋ชฉ๋ก
| ์ฝ๋ | ์ ๋น |
|---|---|
minjoo |
๋๋ถ์ด๋ฏผ์ฃผ๋น |
ppp |
๊ตญ๋ฏผ์ํ |
rebuilding |
์กฐ๊ตญํ์ ๋น |
reform |
๊ฐํ์ ๋น |
basic_income |
๊ธฐ๋ณธ์๋๋น |
jinbo |
์ง๋ณด๋น |
all |
์ ์ฒด (๊ธฐ๋ณธ๊ฐ) |
๋ฌธ์ ํด๊ฒฐ
| ๋ฌธ์ | ํด๊ฒฐ |
|---|---|
| "HF_TOKEN์ด ์ค์ ๋์ง ์์์ต๋๋ค" | .env ํ์ผ์ HF_TOKEN ํ์ธ |
| "Module not found" | setup.bat ๋ค์ ์คํ |
| ํฌ๋กค๋ง์ด ๋๋ ค์ | crawler_config.json์์ concurrent_requests๋ฅผ 30์ผ๋ก ์ฆ๊ฐ |
| ํน์ ์ ๋น๋ง ์คํจ | python main.py --party [์ฝ๋]๋ก ๊ฐ๋ณ ์คํํ์ฌ ํ์ธ |
๋์๋ง
python main.py --help
์ ์ฒด ๋ฌธ์: README.md