Materiały i przydatne linki

Strona polskiego WordNet’u - Słowosieci http://plwordnet.pwr.wroc.pl/wordnet/
Narzędzia do analiz języka naturalnego - język polski http://www.plwordnet.pwr.wroc.pl/narzedzia-i-zasoby
Narzędzia w postaci usług webowych (warto sprawdzić jak one działają tutaj) http://clarin-pl.eu/pl/uslugi/
Google + automatyczne odpowiadanie na maile - https://research.googleblog.com/2015/11/computer-respond-to-this-email.html
Generowanie tekstu https://github.com/karpathy/char-rnn
Sumaryzacja tekstów bazujący na TensorFlow https://github.com/tensorflow/models/tree/master/textsum
Tutoriale dla TensorFlow https://www.tensorflow.org/versions/r0.11/tutorials jest także podrozdział o przetwarzaniu języka
WordNety - warto badania prof. Bonda zobaczyć http://www.ntu.edu.sg/home/fcbond/ oraz Open Multilingual Wordnet http://compling.hss.ntu.edu.sg/omw/
Word2Vec modele dla polskiego - http://mozart.ipipan.waw.pl/~axw/models/lemma/
Model słów Word2Vec, https://clarin-pl.eu/dspace/handle/11321/327. Posiada zwinięte nazwy własne i wielowyrazowce do jednego tokenu. Wielkość wektora pod wektoryzacji słów = 100.
Zbiór danych Opineo https://own.datasciencegroup.pl/index.php/s/nDlYlnptbXmo8BT Uwaga! Gdyby link wygasł proszę o wiadomość w tej sprawie.
Generowanie kolejnych znaków https://github.com/offbit/char-models
CNN dla NLP http://www.wildml.com/2015/11/understanding-convolutional-neural-networks-for-nlp/

jeśli znalazłeś inne materiały, którymi warto się podzielić z resztą grupy napisz (dodatkowe za każde polecenie dodatkowe punkty przy zalcizeniu!)

Written on October 1, 2016