Temat :Analiza danych
Temat :Analiza sentymentów recenzji produktów
Cel :Celem tego zadania jest przeprowadzenie analizy nastrojów na temat recenzji produktów w celu określenia nastawienia recenzenta do produktu.
Instrukcje :
1. Przygotowanie danych :
- Zbierz zbiór danych recenzji produktów z odpowiedniego źródła (np. Amazon, Yelp).
- Wyczyść dane, usuwając zduplikowane recenzje, obsługując brakujące wartości i konwertując tekst na małe litery.
2. Eksploracyjna analiza danych :
- Eksploruj dane, aby zrozumieć ich charakterystykę i rozkład.
- Wykonuj podstawowe statystyki, takie jak liczniki częstotliwości i chmury słów, aby zidentyfikować popularne słowa i wyrażenia używane w recenzjach.
3. Analiza nastrojów :
- Użyj odpowiedniej biblioteki lub narzędzia do analizy nastrojów (np. TextBlob, VADER lub spaCy), aby przypisać oceny nastrojów do każdej recenzji.
- Grupuj recenzje w kategorie pozytywne, negatywne lub neutralne na podstawie ich ocen nastrojów.
4. Inżynieria funkcji :
- Wyodrębnij z recenzji istotne cechy, które mogą przyczynić się do nastrojów. Mogą one obejmować częstotliwość występowania słów, znaki interpunkcyjne lub inne funkcje związane z NLP.
5. Model uczenia maszynowego :
- Opracuj nadzorowany model uczenia maszynowego, aby klasyfikować recenzje jako pozytywne lub negatywne.
- Wytrenuj model na oznaczonych danych i oceń jego działanie przy użyciu odpowiednich wskaźników (np. dokładności, precyzji, zapamiętywania i wyniku F1).
6. Interpretacja modelu :
- Wizualizuj przewidywania modelu za pomocą macierzy zamieszania lub innych odpowiednich wizualizacji.
- Analizuj błędnie sklasyfikowane recenzje, aby zidentyfikować obszary wymagające poprawy.
7. Raportowanie :
- Napisz raport podsumowujący wnioski z analizy nastrojów.
- Dołącz szczegółowe informacje na temat przygotowania danych, eksploracyjnej analizy danych, inżynierii funkcji, uczenia modeli i wyników oceny.
Przesłanie :
- Prześlij następujące informacje:
- Notatnik Jupyter lub skrypt Pythona zawierający Twój kod i analizę.
- Raport w formacie PDF podsumowujący ustalenia.
Termin :
- Termin zadania przypada na [data].
- Spóźnione zgłoszenia będą karane karą w wysokości 10% dziennie.