Materiały i przydatne linki
-
Strona polskiego WordNet’u - Słowosieci http://plwordnet.pwr.wroc.pl/wordnet/
-
Narzędzia do analiz języka naturalnego - język polski http://www.plwordnet.pwr.wroc.pl/narzedzia-i-zasoby
-
Narzędzia w postaci usług webowych (warto sprawdzić jak one działają tutaj) http://clarin-pl.eu/pl/uslugi/
-
Google + automatyczne odpowiadanie na maile - https://research.googleblog.com/2015/11/computer-respond-to-this-email.html
-
Generowanie tekstu https://github.com/karpathy/char-rnn
-
Sumaryzacja tekstów bazujący na TensorFlow https://github.com/tensorflow/models/tree/master/textsum
-
Tutoriale dla TensorFlow https://www.tensorflow.org/versions/r0.11/tutorials jest także podrozdział o przetwarzaniu języka
-
WordNety - warto badania prof. Bonda zobaczyć http://www.ntu.edu.sg/home/fcbond/ oraz Open Multilingual Wordnet http://compling.hss.ntu.edu.sg/omw/
-
Word2Vec modele dla polskiego - http://mozart.ipipan.waw.pl/~axw/models/lemma/
-
Model słów Word2Vec, https://clarin-pl.eu/dspace/handle/11321/327. Posiada zwinięte nazwy własne i wielowyrazowce do jednego tokenu. Wielkość wektora pod wektoryzacji słów = 100.
-
Zbiór danych Opineo https://own.datasciencegroup.pl/index.php/s/nDlYlnptbXmo8BT Uwaga! Gdyby link wygasł proszę o wiadomość w tej sprawie.
-
Generowanie kolejnych znaków https://github.com/offbit/char-models
-
CNN dla NLP http://www.wildml.com/2015/11/understanding-convolutional-neural-networks-for-nlp/
- jeśli znalazłeś inne materiały, którymi warto się podzielić z resztą grupy napisz (dodatkowe za każde polecenie dodatkowe punkty przy zalcizeniu!)