Ефективність методів семантичної мережі для виявлення плагіату речень

Сутність поняття "плагіат документів" та методи виявлення плагіату. Попередня обробка документу - токенізація, видалення стоп-слів та коренів. Семантичне та синтаксичне представлення документів. Алгоритм апроксимованої подібності, побудова N-грам.

12.09.2012 | Програмування | Программирование, компьютеры и кибернетика | Язык: украинский | Просмотры: 88