Система зберігання студентських робіт з можливістю пошуку по тексту та перевірки на плагіат (мобільний додаток)
PDF
В роботі розглядаються в теоретичному і практичному плані такі питання:
• Методи аналізу довільних текстів і вихідних кодів програм з точки зору наявності ідентичних фрагментів;
• Розробка набору інструментів аналізу вихідних кодів програм з двох взаємно доповнюють модулів: перший аналізує вихідний код методами аналізу вихідних кодів (частотного аналізу і аналізу токенізірованной послідовності операторів) в програмних модулях студентів на основі поповнюється текстової бази даних (БД), а другий дозволяє аналізувати цей же вихідний код методами аналізу довільних текстів;
• Реалізація в другому модулі алгоритму пошуку запозичених фрагментів у вихідних кодах програм, інтегруючого структурний аналіз кодів (на основі вихідного або токенізірованного уявлення), методу шинглів, дистанції Левенштейна і знаходження найбільшої спільної підпослідовності (longest common subsequence, LCS) для довільних текстів. Якщо другий модуль розглядає довільний текст як вихідний код програми (в модулі не встановлено прапорець «Текст»), то він використовує ту ж саму пополняемую БД робіт студентів, яку формує перший модуль.
Все це в сукупності дозволяє значно розширити можливості перевіряючого в частині візуалізації підозрілих фрагментів коду і більш глибокого аналізу порівнюваних текстів.