- http://www.pathcom.com/~vadco/dawg.html
- http://cedar-solutions.com/software/wordutils/interface/public/WordUtils.dawg-module.html
- http://en.wikipedia.org/wiki/Directed_acyclic_word_graph
В купі з hadoop map/reduce виглядає багатообіцяюче. Схоже скоро таки появиться якась аналітика/дата майнінг на ньюсах. Таки чистого full text search інструментарію малувато.
Подивився в неті кілька анотацій лінгвістичних дисертацій. Щось таки люди роблять в галузі аналізу текстів. Принаймні філологи :-)
No comments:
Post a Comment