Ефективність методів семантичної мережі для виявлення плагіату речень
Сутність поняття "плагіат документів" та методи виявлення плагіату. Попередня обробка документу - токенізація, видалення стоп-слів та коренів. Семантичне та синтаксичне представлення документів. Алгоритм апроксимованої подібності, побудова N-грам.
12.09.2012 |
Програмування |
Программирование, компьютеры и кибернетика |
Язык: украинский |
Просмотры: 88