Re: использования AI для детектирования вирусов
От: BlackEric http://black-eric.lj.ru
Дата: 27.10.23 09:23
Оценка: 12 (1)
Здравствуйте, sergey2b, Вы писали:

S>я сейчас пишу дипломную работу и в качестве темы я выбрал написать engine который будет детектировать вирусы с использованием AI

S>детектор типа файлов и унпакеры я использую готовые

S>как вы считаете какие критерии бинарного файла можно взять за критерии детектирование вирусов


S>тк это учебный проект я планирую использовать


S>полный список вызываемых системных функций

S>последовательность вызова системных функций

S>n-gram первых 1024 команд выполняемых прилодением



S>как вы считаете какие еше критерии можно использовать


Самое интересное, что я тоже

Я уже спрашивал про это. Вот тема: Машинное обучение и вредоносные файлы
Автор: BlackEric
Дата: 15.01.22
https://github.com/BlackEric001
Re: использования AI для детектирования вирусов
От: vsb Казахстан  
Дата: 27.10.23 09:27
Оценка: 12 (1)
Все ascii строки из файла
Re[3]: использования AI для детектирования вирусов
От: BlackEric http://black-eric.lj.ru
Дата: 27.10.23 13:59
Оценка: 12 (1)
Здравствуйте, sergey2b, Вы писали:

S>Вам удалось получить вписать что то работающее ?

S>Если не секрет какой AI engine вы использовали

В процессе. Использую Keras со сверточной сетью.
https://github.com/BlackEric001
Re: использования AI для детектирования вирусов
От: mtnl  
Дата: 28.10.23 09:44
Оценка: 12 (1)
Здравствуйте, sergey2b, Вы писали:

S>как вы считаете какие еше критерии можно использовать


на kaggle лет пять назад было соревнование на эту тему от вроде бы microsoft, там есть открытые блокноты с решениями, думаю стоит их посмотреть (с какой стороны заходили и какие критерии использовали)
Re[2]: использования AI для детектирования вирусов
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 31.10.23 17:05
Оценка: 12 (1)
Здравствуйте, Michael7, Вы писали:

M>Начиная с определения, а что собственно говоря, собираешь детектировать? Я помню еще довольно давно были большие споры и в общем безупречно четкого определения, что такое вирус (компьютерный) кажется никто родить так и не смог.


Кажется, что определение — это как раз фигня. Есть вполне конкретная база программ, которые считаются вредоносными, есть все остальные. Чтобы нейросеть научилась детектировать лица ей не надо давать определение лица. Так и тут: чем круче эвристики алгоритмы классификации, тем круче антивирус. Кажется, та же Positive technologies нейросетями для того уже лет 10 занимается.
Re[7]: использования AI для детектирования вирусов
От: BlackEric http://black-eric.lj.ru
Дата: 30.10.23 17:05
Оценка: 9 (1)
Здравствуйте, sergey2b, Вы писали:

S>Здравствуйте, BlackEric, Вы писали:



BE>>Я потому и хочу использовать Keras, что он позволяет сохранить модель в стандартный h5 формат и использовать в том же dotnet.


S>я собирал ubuntu 22.04 python2


S>http://files.rsdn.org/56990/ch8.zip


S>напишите если будут проблеммы


Спасибо, буду изучать.

Есть еще такая штука: Elastic Malware Benchmark for Empowering Researchers

Я пробую делать пока на ней.
https://github.com/BlackEric001
использования AI для детектирования вирусов
От: sergey2b ЮАР  
Дата: 26.10.23 13:48
Оценка: :)
я сейчас пишу дипломную работу и в качестве темы я выбрал написать engine который будет детектировать вирусы с использованием AI
детектор типа файлов и унпакеры я использую готовые

как вы считаете какие критерии бинарного файла можно взять за критерии детектирование вирусов

тк это учебный проект я планирую использовать

полный список вызываемых системных функций
последовательность вызова системных функций

n-gram первых 1024 команд выполняемых прилодением


как вы считаете какие еше критерии можно использовать
Re[3]: использования AI для детектирования вирусов
От: Alekzander  
Дата: 29.10.23 11:05
Оценка: +1
Здравствуйте, sergey2b, Вы писали:

vsb>>Все ascii строки из файла


S>Да строкам являющимся параметрами функций дают больший вес


А смысл? В одной конторе так заманались бороться с false positive'ами на основе анализа строк, что стали их все тупо шифровать. Это сделать просто — написал макрос S() и пару функций crypt()/decrypt(), и готово. И ведь контора даже не зловреды писала, а просто софт в тех категориях, которые АВ не любят. Неужели авторы настоящих зловредов тупее?
Re: использования AI для детектирования вирусов
От: Sharov Россия  
Дата: 07.11.23 16:59
Оценка: +1
Здравствуйте, sergey2b, Вы писали:

Что за курс?
Кодом людям нужно помогать!
Re: использования AI для детектирования вирусов
От: sergey2b ЮАР  
Дата: 26.10.23 18:31
Оценка:
Здравствуйте, sergey2b, Вы писали:

я планировал опираться на теорию вот из этого видео
https://www.youtube.com/watch?v=VLQTRlLGz5Y
Re[2]: использования AI для детектирования вирусов
От: sergey2b ЮАР  
Дата: 27.10.23 13:01
Оценка:
Здравствуйте, vsb, Вы писали:

vsb>Все ascii строки из файла


Да строкам являющимся параметрами функций дают больший вес
Re[2]: использования AI для детектирования вирусов
От: sergey2b ЮАР  
Дата: 27.10.23 13:02
Оценка:
Вам удалось получить вписать что то работающее ?
Если не секрет какой AI engine вы использовали
Re[4]: использования AI для детектирования вирусов
От: sergey2b ЮАР  
Дата: 29.10.23 04:30
Оценка:
Здравствуйте, BlackEric, Вы писали:

https://dl1.newoutlook.it/book/2021/03/21/Malware.pdf

https://github.com/d84-n1nj4/malwareDataScience/tree/master/ch8/code


после некоторой правки пример из 8 главы заработал и даже детектирует
но я хотел бы получить доступ к модели из С/С++

но пока не знаю как
Отредактировано 29.10.2023 4:31 sergey2b . Предыдущая версия .
Re[2]: использования AI для детектирования вирусов
От: BlackEric http://black-eric.lj.ru
Дата: 29.10.23 11:14
Оценка:
Здравствуйте, mtnl, Вы писали:

M>Здравствуйте, sergey2b, Вы писали:


S>>как вы считаете какие еше критерии можно использовать


M>на kaggle лет пять назад было соревнование на эту тему от вроде бы microsoft, там есть открытые блокноты с решениями, думаю стоит их посмотреть (с какой стороны заходили и какие критерии использовали)


Вот этот конкурс: Microsoft Malware Classification Challenge (BIG 2015)
https://github.com/BlackEric001
Re[5]: использования AI для детектирования вирусов
От: BlackEric http://black-eric.lj.ru
Дата: 29.10.23 11:16
Оценка:
Здравствуйте, sergey2b, Вы писали:

S>Здравствуйте, BlackEric, Вы писали:


S>https://dl1.newoutlook.it/book/2021/03/21/Malware.pdf


S>https://github.com/d84-n1nj4/malwareDataScience/tree/master/ch8/code



S>после некоторой правки пример из 8 главы заработал и даже детектирует

S>но я хотел бы получить доступ к модели из С/С++

S>но пока не знаю как


А что за правки? Может и себе использую.


Я потому и хочу использовать Keras, что он позволяет сохранить модель в стандартный h5 формат и использовать в том же dotnet.
https://github.com/BlackEric001
Re[6]: использования AI для детектирования вирусов
От: sergey2b ЮАР  
Дата: 29.10.23 22:24
Оценка:
Здравствуйте, BlackEric, Вы писали:


BE>Я потому и хочу использовать Keras, что он позволяет сохранить модель в стандартный h5 формат и использовать в том же dotnet.


я собирал ubuntu 22.04 python2

http://files.rsdn.org/56990/ch8.zip

напишите если будут проблеммы
Re[4]: использования AI для детектирования вирусов
От: Vzhyk2  
Дата: 30.10.23 06:36
Оценка:
Здравствуйте, BlackEric, Вы писали:

BE>В процессе. Использую Keras со сверточной сетью.

Я бы на твоем месте за основу взял LSTM (RNN и т.п.) и к ней уже добавлял сверточные слои.
Re: использования AI для детектирования вирусов
От: Michael7 Россия  
Дата: 31.10.23 16:17
Оценка:
Здравствуйте, sergey2b, Вы писали:

S>я сейчас пишу дипломную работу и в качестве темы я выбрал написать engine который будет детектировать вирусы с использованием AI

S>детектор типа файлов и унпакеры я использую готовые

Дипломная работа конечно это неплохо, но с точки зрения практической пользы очень огромные вопросы возникают. Начиная с определения, а что собственно говоря, собираешь детектировать? Я помню еще довольно давно были большие споры и в общем безупречно четкого определения, что такое вирус (компьютерный) кажется никто родить так и не смог.
Re[2]: использования AI для детектирования вирусов
От: sergey2b ЮАР  
Дата: 31.10.23 16:37
Оценка:
Я знаю как конвертировать в деньги, тема не 100% но шанс хороший

Я когда то написал metadefender.com и продал
Теперь я придумал как улучшить его функционал при помощи AI
Re[3]: использования AI для детектирования вирусов
От: Michael7 Россия  
Дата: 31.10.23 19:36
Оценка:
Здравствуйте, Nuzhny, Вы писали:

N>Кажется, что определение — это как раз фигня. Есть вполне конкретная база программ, которые считаются вредоносными, есть все остальные.


Понятие вредоносных еще более мутное, чем вирусов. Туда, например, кряки помещают или емнип даже какие-то читы к онлайн-играм типа WoW попадали.

N> Чтобы нейросеть научилась детектировать лица ей не надо давать определение лица.


При этом ей важно давать качественно подобранный датасет, а не мусор. То есть, если будешь кормить нейросеть, кроме человеческих лиц, еще и изображениями медвежих задниц и восковых свечек, то полную чепуху получишь, а не распознавание. И вообще, нейросеть — это не черный ящик с магией, для достижения действительно полезных практических результатов надо хорошо понимать что и как делаешь. А тут проблема прямо сразу рисуется — не совсем понятно, что вообще объектом обучения считать. С ней будет или большое количество ложно-положительных результов или низкая вероятность детекции.
Re[4]: использования AI для детектирования вирусов
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 31.10.23 19:51
Оценка:
Здравствуйте, Michael7, Вы писали:

M>Понятие вредоносных еще более мутное, чем вирусов. Туда, например, кряки помещают или емнип даже какие-то читы к онлайн-играм типа WoW попадали.


И в чём проблема-то? Классификация бывает не только бинарная.

M>А тут проблема прямо сразу рисуется — не совсем понятно, что вообще объектом обучения считать. С ней будет или большое количество ложно-положительных результов или низкая вероятность детекции.


Так в чём проблема? Ты можешь описать? Почему нельзя классифицировать не бинарно (вредно, полезно), а поумнее? Что мешает сделать много разных классов, ансамбль сетей и т.д.?
Re[5]: использования AI для детектирования вирусов
От: Michael7 Россия  
Дата: 31.10.23 20:15
Оценка:
Здравствуйте, Nuzhny, Вы писали:

N>И в чём проблема-то? Классификация бывает не только бинарная.


Вообще проблема в том, что вредоносность программы — это более юридическое понятие, чем техническое. Даже для реальных вирусов, а тем более для того, что и большинство пользователей не сочтут для себя вредоносным. Не, ну нейросети можно и на юридические аспекты тренировать, если ей их суметь представить в виде каких-то признаков. Просто чисто программного кода тут боюсь недостаточно.

N>Так в чём проблема? Ты можешь описать? Почему нельзя классифицировать не бинарно (вредно, полезно), а поумнее? Что мешает сделать много разных классов, ансамбль сетей и т.д.?


Сети и так редко классифицируют бинарно, обычно выдается вероятность соответствия предъявленного образца какому-то классу, а классов может быть действительно много и т.д. Но в таком виде это скорее инструмент для исследователя, а не обычного конечного пользователя. Что он будет делать с этим набором, просто скачав какую-то программу?

Кстати, я совсем забыл, что помимо отнсения к вредным разных в общем-то безобидных прогрмм, есть и обратная проблема — полно софта, который по всем привычным меркам надо было бы считать вредоносным, но считается приличным. Например, софт с телеметрией, тем более неотключаемой.

В общем, мне кажется с точки зрения пользы было бы интереснее, на мой взгляд, искать не malware, а уязвимости в имеющемся софте, в том числе или даже в первую очередь, по анализу бинарника. Анализаторы исходного текста имеются, а вот бинарников и чтобы автоматически явно меньше, если есть.
Re[6]: использования AI для детектирования вирусов
От: sergey2b ЮАР  
Дата: 31.10.23 20:54
Оценка:
Здравствуйте, Michael7, Вы писали:

>Сети и так редко классифицируют бинарно, обычно выдается вероятность соответствия предъявленного образца какому-то классу, а классов может быть действительно много и т.д. Но в таком виде это скорее инструмент для исследователя, а не обычного конечного пользователя. Что он будет делать с этим набором, просто скачав какую-то программу?


в отличии от существляется антивирусов
классификация осуществляеться не только по сигнатуре

возможно автоматическое выделение признаком для классификации
Re[8]: использования AI для детектирования вирусов
От: sergey2b ЮАР  
Дата: 05.11.23 09:57
Оценка:
Здравствуйте, BlackEric, Вы писали:

я сделал класификацию с учетом:

строк в файле
импортируемых функций
последовательность вызываемых функций


вот такой результат

files.rsdn.org/56990/all.png



могу добавить ngram скажем первых 100 выполимых команд
Отредактировано 05.11.2023 9:58 sergey2b . Предыдущая версия .
Re[9]: использования AI для детектирования вирусов
От: BlackEric http://black-eric.lj.ru
Дата: 05.11.23 10:23
Оценка:
Здравствуйте, sergey2b, Вы писали:


S>




S>могу добавить ngram скажем первых 100 выполимых команд


Не плохо, спасибо
https://github.com/BlackEric001
Re: использования AI для детектирования вирусов
От: Вумудщзук Беларусь  
Дата: 07.02.24 12:33
Оценка:
>engine который будет детектировать вирусы с использованием AI
>как вы считаете какие критерии бинарного файла можно взять за критерии детектирование вирусов
тут нет никакого противоречия?

если в системе просто применяется некий конкретный алгоритм для классификации объектов, то это не AI, а просто алгоритм.
у нейросетей же идея в том, чтоб обучить на примерах, когда алгоритм невозможно выписать принципиально или он слишком многокритериальный/сложный/нечёткий и т.п. Учим нейрону на известных примерах, после чего пытаемся с её помощью классифицировать неизвестные
Re[5]: использования AI для детектирования вирусов
От: Слава  
Дата: 07.02.24 13:53
Оценка:
Здравствуйте, Nuzhny, Вы писали:

M>>А тут проблема прямо сразу рисуется — не совсем понятно, что вообще объектом обучения считать. С ней будет или большое количество ложно-положительных результов или низкая вероятность детекции.


N>Так в чём проблема? Ты можешь описать? Почему нельзя классифицировать не бинарно (вредно, полезно), а поумнее? Что мешает сделать много разных классов, ансамбль сетей и т.д.?


Действительно, что же мешает? В форуме по Shareware спросите, что же мешает авторам антивирусов не копипастить друг у друга false positives, обсуждения которых забивают поисковую выдачу и отпугивают покупателей? Что же мешает штрафовать авторов херовых антивирусов (а они все такие) и почему антивирус должен быть детерминированным, а нейросети этому только помешают?
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.