29.02.2024
Подписывайтесь на Telegram-канал по ссылке

Создана система, которая умеет определять автора исходного кода

Complex Cases of Source Code Authorship Identification

Исследователи Томского государственного университета систем управления и радиоэлектроники (ТУСУР) разработали систему, позволяющую определять автора по стилю написания кода. Разработчики считают, что система позволит устанавливать случаи плагиата и вычислять авторов вредоносов. Исследование опубликовано в научном журнале Future Internet.

Система построена на базе машинного обучения, которое анализирует исходный код и определяет в нём индивидуальный почерк разработчика. Кроме этого, система может отличать код, написанный человеком, от кода, сгенерированного машиной. Можно не просто установить авторство, но и определить, какая генеративная модель занималась созданием кода.

В университете отметили, что результаты работы уже имеющихся решений сильно зависят от количества входных данных и языков программирования, на которых написан код. Система от исследователей ТУСУР определяет автора кода, который владеет двумя языками программирования со средней точностью 87%, тремя и более — 76%, а в случае кода, сгенерированного искусственным интеллектом, — 81,5%. В ближайшем будущем планируется реализовать анализ уже скомпилированного кода, что поможет эффективно распознавать авторов вирусов.