hse-python-assistant/README.md

53 lines
2.1 KiB
Markdown
Raw Normal View History

2024-10-16 20:24:08 +00:00
# hse-python-assistant
## Ссылки
Тестирующая система: https://dsworks.ru/champ/hse-2024-october \
Лендинг: https://www.hse.ru/ai-assistant-hack-python/
## Запуск
2024-10-18 20:44:44 +00:00
Перед запуском необходимо загрузить модель. В данный момент мы её выгружаем, скинем ссылку ASAP. После этого поменяйте параметр `model_path` в `main.py` на абсолютный путь к модели.
### Docker
```
docker compose up
```
### Poetry
```
poetry install
poetry run python main.py
```
2024-10-16 20:24:08 +00:00
## Структура проекта
```
.
├── app
│   ├── __init__.py
2024-10-18 20:44:44 +00:00
│   ├── models <------------------------ Подключаемые модели
│   └── utils <------------------------ Утилиты
2024-10-16 20:24:08 +00:00
├── data
2024-10-18 20:44:44 +00:00
│   ├── processed <----------------------- Промежуточный этап подготовки данных
│   └── raw <----------------------------- Исходные данные
2024-10-16 20:24:08 +00:00
│   ├── submit_example.csv
│   ├── test
│   │   ├── solutions.xlsx
│   │   ├── tasks.xlsx
│   │   └── tests.xlsx
│   └── train
│   ├── solutions.xlsx
│   ├── tasks.xlsx
│   └── tests.xlsx
├── main.py <---------------------------- [ВАЖНО] Именно этот скрипт мы будем запускать при проверке ваших решений. Он должен генерировать финальный сабмит.
2024-10-18 20:44:44 +00:00
├── notebooks
│ └── finetuning.ipynb <---------------------------- Процесс файнтюнинга модели
2024-10-16 20:24:08 +00:00
├── poetry.lock
├── pyproject.toml
├── README.md
└── tests
2024-10-18 20:44:44 +00:00
├── test_correctness.py <------------------------ Проверить на корректность сабмит
└── test_embedding_generation.py <--------------- Попробовать генерацию эмбеддингов и подсчёт метрики
```