Materiały i przydatne linki

  1. Strona polskiego WordNet’u - Słowosieci http://plwordnet.pwr.wroc.pl/wordnet/

  2. Narzędzia do analiz języka naturalnego - język polski http://www.plwordnet.pwr.wroc.pl/narzedzia-i-zasoby

  3. Narzędzia w postaci usług webowych (warto sprawdzić jak one działają tutaj) http://clarin-pl.eu/pl/uslugi/

  4. Google + automatyczne odpowiadanie na maile - https://research.googleblog.com/2015/11/computer-respond-to-this-email.html

  5. Generowanie tekstu https://github.com/karpathy/char-rnn

  6. Sumaryzacja tekstów bazujący na TensorFlow https://github.com/tensorflow/models/tree/master/textsum

  7. Tutoriale dla TensorFlow https://www.tensorflow.org/versions/r0.11/tutorials jest także podrozdział o przetwarzaniu języka

  8. WordNety - warto badania prof. Bonda zobaczyć http://www.ntu.edu.sg/home/fcbond/ oraz Open Multilingual Wordnet http://compling.hss.ntu.edu.sg/omw/

  9. Word2Vec modele dla polskiego - http://mozart.ipipan.waw.pl/~axw/models/lemma/

  10. Model słów Word2Vec, https://clarin-pl.eu/dspace/handle/11321/327. Posiada zwinięte nazwy własne i wielowyrazowce do jednego tokenu. Wielkość wektora pod wektoryzacji słów = 100.

  11. Zbiór danych Opineo https://own.datasciencegroup.pl/index.php/s/nDlYlnptbXmo8BT Uwaga! Gdyby link wygasł proszę o wiadomość w tej sprawie.

  12. Generowanie kolejnych znaków https://github.com/offbit/char-models

  13. CNN dla NLP http://www.wildml.com/2015/11/understanding-convolutional-neural-networks-for-nlp/

  • jeśli znalazłeś inne materiały, którymi warto się podzielić z resztą grupy napisz (dodatkowe za każde polecenie dodatkowe punkty przy zalcizeniu!)
Written on October 1, 2016