УДК 343.9
DOI 10.17150/2500-4255.2019.13(2).262-270
ВОЗМОЖНОСТИ ИСПОЛЬЗОВАНИЯ КОНТЕКСТНОГО ПОИСКА ИНФОРМАЦИИ НА КОМПЬЮТЕРНЫХ НОСИТЕЛЯХ В ЦЕЛЯХ ВЫЯВЛЕНИЯ, РАССЛЕДОВАНИЯ И ПРОФИЛАКТИКИ ПРЕСТУПЛЕНИЙ
А.Г. Себякин1& 2
Аннотация. Контекстный поиск информации в настоящее время активно используется различными подразделениями правоохранительных органов в целях выявления, расследования и профилактики преступлений. Данный инструмент может применяться как для поиска информации в сети Интернет, так и при исследовании локальных цифровых информационных носителей. Тем не менее задача контекстного поиска сегодня не имеет однозначного определения, также неоднозначно ее место среди задач компьютерно-технической экспертизы. Автором в статье рассматриваются различные проблемные аспекты контекстного поиска: его понятие, место в системе задач судебной экспертизы, современное понимание задачи контекстного поиска в других, в том числе смежных, отраслях науки. В работе дается описание методов контекстного поиска при исследовании цифровой информации в рамках компьютерно-технической экспертизы, а также характеризуются инструменты, находящиеся в распоряжении сведущего лица и позволяющие решать задачу контекстного поиска. На основании проведенного анализа высказывается мнение, что контекстный поиск информации является не самостоятельной экспертной задачей, а частью более обширной экспертной задачи. Также в статье исследуются взгляды ученых на понятие контекстного поиска информации, выдвигается тезис о необходимости расширения этого понятия в свете современного состояния развития вычислительной техники: необходимо рассматривать его как метод поиска фрагментов текстовых записей не только в текстовых, но и в графических файлах. Особое внимание уделяется вопросу эффективности применения контекстного поиска информации в сети Интернет, в том числе в ее теневом сегменте, с целью предупреждения и профилактики преступлений, анализируются преимущества и недостатки поисковых механизмов интернет-ресурсов и метапоисковых систем.
THE POSSIBILITIES OF USING CONTEXTUAL INFORMATION SEARCH ON COMPUTER MEDIA TO IDENTIFY, INVESTIGATE AND PREVENT CRIMES
Alexey G. Sebyakin1& 2
Abstract. Contextual search is now actively used by various divisions of the law enforcement bodies to identify, investigate and prevent crimes. This instrument could be used both to search information online and to analyze local digital information carriers. Still, the task of contextual search does not currently have a single definition, and its place among the tasks of computer forensic examination is not clearly determined. The author examines various problem aspects of contextual search: its concept, its place among the tasks of forensic examination, modern understanding of the task of contextual search in other, including related, branches of science. The author describes contextual search methods in researching digital information within the framework of computer forensic m examination and characterizes instruments which an expert could use to deal with the 8 task of contextual search. Using this analysis, the author argues that contextual search is 4 not an independent expert task, but a part of a more extensive expert task. The author x also presents the views of different researchers on the concept of contextual information J
search and states that it is necessary to widen this concept in the light of the contem- u
Информация о статье Дата поступления 11 января 2018 г.
Дата принятия в печать 8 апреля 2019 г.
Дата онлайн-размещения 26 апреля 2019 г.
Article info
Received
Accepted
Available online 2019 April 26
Contextual search; Internet; social network; local data; expert task; specialist; expert; graphic image
porary advances in the development information technology: it should be viewed as a method of searching for text fragments not only in the text files, but also in the graphic files. Special attention should be paid to the question of the effectiveness of using contextual search on the Internet, including its shadow segment, with the aim of crime prevention and prophylaxis, the author also analyzes the advantages and disadvantages of search mechanisms in online resources and meta-search systems.
Сеть Интернет, являющаяся одним из самых емких открытых источников информации, накапливает на своих ресурсах совершенно разнообразные сведения и данные. Логично, что Интернетом пользуются не только законопослушные граждане, но и лица, преследующие преступные цели. Все деяния, представляющие опасность для общества и совершаемые посредством сети Интернет, как пишет В.С. Соловьев, условно делятся на две группы: деяния, связанные с взаимодействием человека и техники, и деяния, связанные с взаимодействием человека с человеком (группой людей) посредством технических средств. Именно деяния, связанные с коммуникацией между людьми, представляют собой ощутимую угрозу для криминологической безопасности общества [1, с 61]. Значительная часть таких преступлений совершается в социальных сетях с использованием Интернета. Автор разделяет мнение В.С. Соловьева о том, что понятие социальной сети в криминологическом аспекте нужно трактовать в более широком смысле, чем традиционное представление о социальных сетях типа «Одноклассники», «ВКонтакте», «Фейс-бук» и пр. К социальным сетям необходимо отнести также и разнообразные мессенджеры (такие, как Viber, WhatsApp, Skype и пр.), поскольку их функционал в настоящее время значительно расширился относительно изначального вида и позволяет осуществлять практически любые виды коммуникации (текстовые сообщения, речь, видео-конференц-связь, пересылка данных в виде файлов и др.). Организация социального взаимодействия посредством мессенджеров возможна фактически на таком же уровне, как и в традиционной социальной сети.
Наиболее часто встречающимися видами преступлений, основывающихся на взаимодействии людей (сообществ) в сети Интернет, являются незаконный оборот наркотических веществ, мошенничество, преступления, связанные с экстремистской и террористической деятельностью, распространение порнографических материалов и развратные действия, незаконная игровая деятельность. В связи с этим перед правоохранительными органами стоит
задача — выявление, пресечение и предотвращение преступлений, совершаемых с использованием сети Интернет. Одним из основных способов решения данной задачи является контекстный поиск информации.
Осуществление оперативными подразделениями правоохранительных структур контекстного поиска в сети Интернет позволяет производить сбор и анализ значимой информации, а также проводить мероприятия, нацеленные на предотвращение и профилактику указанных преступлений. В качестве положительного примера использования контекстного поиска можно привести отслеживание деятельности экстремистских организаций: определение координаторов, лидеров, установление фактов подготовки и планирования акций и т.д. [2, с 66]. В процессе оперативной работы с применением контекстного поиска проводится выявление распространителей порнографической продукции, а также лиц, пытающихся совершить развратные действия, в том числе в отношении несовершеннолетних.
В настоящее время контекстный поиск выступает одной из наиболее востребованных задач в ходе расследования преступлений. По статистике, накопленной в экспертно-кримина-листическом отделе СУ СК России по Иркутской области, в 25 % случаев сегодня специальные знания в области компьютерной техники при расследовании преступлений ориентированы на решение задачи контекстного поиска. Данная задача в 61 % случаев решается в процессе проведения следственного осмотра с участием специалиста и только в 39 % случаев — путем производства судебной компьютерно-технической экспертизы.
Контекстный поиск — это одна из разновидностей задачи поиска информации на компьютерных носителях. Поиск и обнаружение информации традиционно относятся к вопросу судебной информационно-компьютерной экспертизы [3, с 62]. Данный вид экспертизы является «ключевым видом СКТЭ, так как позволяет завершить целостное построение доказательственной базы путем разрешения большинства диагностических и идентификационных
вопросов» [4, c. 122], однако при его описании не указывается, к какому виду задач относится поиск информации — идентификационной или диагностической. Для ответа на данный вопрос обратимся к классическому определению идентификационной задачи. Понятие «идентификация» происходит от латинского слова identificare («тот же самый, тождественный») и означает установление тождества того или иного объекта. В криминалистической идентификации помимо установления тождества существует также установление единого целого и установление общей родовой или групповой принадлежности. Применяя данное определение к объекту судебной информационно-компьютерной экспертизы, которым является файл с данными [5, c. 15], можно увидеть, что в части поиска конкретного файла задачу поиска можно отнести к идентификационной, поскольку осуществляется поиск определенного файла, обладающего родовыми, групповыми и индивидуализирующими признаками. Индивидуализирующие признаки применительно к цифровым объектам, в частности файлам, следует понимать в расширительном толковании, поскольку с любого цифрового объекта может быть получена абсолютная копия (дубликат).
Однако если проблему поиска информации рассматривать в разрезе поиска по ключевым словам, то она перестает быть идентификационной, поскольку ключевое слово может содержаться в файлах, обладающих совершенно различными родовыми признаками, не говоря уже о признаках групповых или индивидуализирующих. Такая задача должна быть отнесена скорее к разряду диагностических, поскольку они нацелены на «выявление механизма события, времени, способа и последовательности действий, событий, явлений, причинных связей
между ними, природы, качественных и количественных характеристик объектов, их свойств и признаков, не поддающихся непосредственному восприятию и т.д.» [6, с 21]. В соответствии с перечнем диагностических задач, решаемых в отношении информационных объектов, наиболее близкой задачей, отвечающей смыслу контекстного поиска, является установление свойств и вида представления информации в компьютерной системе при ее непосредственном использовании [7, с 130]. Если трактовать термин «полнота информации» как достаточность данных для понимания и принятия решения, то контекстный поиск представляет собой механизм установления такого свойства, как полнота информации. Наличия ключевого слова и словосочетания в объекте исследования (файле) достаточно, чтобы принять решение о необходимости представления исследуемого файла следователю.
Рассматривая проблему контекстного поиска информации, стоит также обратить внимание, что работа сведущего лица по обнаружению определенной информации сводится к его взаимодействию с поисковой системой, которая осуществляет поиск информации в соответствии с заданным алгоритмом. Условно данную работу можно представить в виде блок-схемы (рис.).
Результатом выполнения поискового алгоритма может быть факт либо наличия, либо отсутствия искомой информации. То есть сведущее лицо, по сути, является оператором поисковой системы. Соответственно, исследование как процесс познавательной деятельности, ориентированный на выработку нового, выводного знания (т.е. знания, полученного не из непосредственного наблюдения, а из другого знания посредством умозаключения), при решении данной
Процесс поиска информации Information search process
задачи отсутствует. Таким образом, работа по обнаружению информации требует специальных знаний в области компьютерной техники, но не требует проведения исследования. Это подтверждается тем, что, как указано в начале настоящей статьи, большая часть информации, требующей процедуры поиска (в том числе контекстного), осуществляется в процессе осмотра носителей при проведении следственных действий с участием специалиста. Согласно же п. 20 постановления Пленума Верховного Суда РФ от 21 декабря 2010 г. № 28, «специалист не проводит исследование вещественных доказательств и не формулирует выводы, а лишь высказывает суждение по вопросам, поставленным перед ним сторонами»1. Данная позиция относится к заключению специалиста, но она представляется тем более справедливой и для иных процессуальных действий с участием специалиста, таких как осмотр, допрос специалиста. Вообще, проблема использования специальных знаний вне рамок судебной экспертизы в настоящее время вызывает массу научных дискуссий, касающихся регламентации использования специальных знаний [8, с. 751], применения специальных знаний в судопроизводстве [9; 10]. В рассматриваемом нами аспекте интересен взгляд О.Ю. Антонова именно на криминалистическое значение заключения (как суждения) и показаний специалиста [11], поскольку использование специальных знаний вне рамок судебной экспертизы вызвано в том числе целями оперативного сопровождения следствия. В случае когда в рамках расследования необходимо максимально быстро получить информацию, более эффективным средством является привлечение именно специалиста в области компьютерной техники, поскольку судебная экспертиза ввиду ее строгой регламентации проводится менее оперативно.
Возможно, контекстный поиск информации выступает частью более обширной экспертной задачи, включающей в себя такие методы ее решения, как анализ и синтез полученной информации. Но при рассмотрении контекстного поиска информации как самостоятельной задачи выявляются определенные противоречия. Поэтому решаемые на практике задачи, требующие специальных знаний в области компьютерной техники, достаточно сложно дифференцировать
согласно классическим представлениям теории судебной экспертизы. Как отмечают Е.Р. Россин-ская и А.И. Усов, большая часть экспертных задач компьютерно-технической экспертизы «конкретизируются при производстве определенной экспертизы... могут разрешаться пока только в частных случаях либо при условии развития экспертных методов и средств в перспективе» [4, с. 135]. Сложившаяся же практика демонстрирует возможность успешного осуществления контекстного поиска информации без проведения экспертного исследования в рамках проведения осмотра с участием специалиста. Соответственно, можно заключить, что контекстный поиск информации в чистом виде не является исследованием.
Тем не менее задача контекстного поиска как разновидность задачи поиска информации остается актуальной вне зависимости от ее отнесения к какому-либо классу. Она возникает практически при каждом осмотре персонального компьютера, а также в ходе производства экспертиз при расследовании дел экономической направленности, когда следователю необходимо провести анализ документов, содержащих определенные ключевые слова. Этими словами могут быть реквизиты организации (наименование, ИНН, номер счета и пр.), фамилии должностных лиц (директора, бухгалтера и пр.), наименования документов (платежное поручение, расходная накладная, договор, приказ и т.д.). Например, в рамках расследования уголовного дела № 17291 по признакам преступления, предусмотренного ч. 1. ст. 199 УК РФ, по факту уклонения от уплаты налогов в ходе проведения судебной экспертизы экспертом путем контекстного поиска были обнаружены файлы, содержащие название организации (ООО «Союз»), а также файлы, содержащие реквизиты (ИНН) данной организации2. В рамках же расследования уголовного дела № 31578 по признакам преступления, предусмотренного ч. 3 ст. 163 УК РФ, по факту вымогательства задача контекстного поиска была решена путем проведения осмотра с участием специалиста. Результатом осмотра явилось обнаружение файлов, содержащих слова «РЦК», «Голотвин» и пр.3
Необходимость контекстного поиска также возникает при расследовании уголовных дел, связанных с незаконной организацией игорной деятельности. В этом случае следователя интересуют файлы, содержащие слова «ставка», «выигрыш» и т.п. Так, в результате судебной компьютерно-технической экспертизы, проведенной в рамках материала доследственной проверки № 18 от 28 января 2016 г. по факту осуществления азартных игр с использованием игрового оборудования вне игорной зоны, были обнаружены файлы, содержащие слова «ставка», «участник», «игра», «сумма», «выигрыш»4.
В прямом понимании термин «контекстный поиск» подразумевает метод поиска фрагментов текстовых записей, заключающийся в сравнении их с заданной пользователем последовательностью символов. В более широком смысле контекстный поиск предусматривает применение языка регулярных выражений, который использует метасимволы, задает правила поиска (шаблон, маску) и тем самым расширяет спектр искомых вариантов текста. Классически поиск файлов, содержащих определенный текст, состоит из двух процедур — поиск текстовых файлов и поиск графических файлов, содержащих текст.
При этом считается, что указанные задачи ввиду их особенностей предусматривают раздельное решение. В настоящее время поиск фрагмента текста в текстовых файлах достаточно хорошо разработан, описан в литературе [7, с. 138-146; 12, с. 120-124; 13, с. 128-132], многократно опробован на практике и является неотъемлемой частью фактически любого специализированного экспертного программного обеспечения (начиная с программ типа AVSearch и «Архивариус» и заканчивая программными пакетами EnCase от Guidance Software и FTK от AccessData). Несколько сложнее дело обстоит с поиском и анализом графических файлов, содержащих текст.
В научной литературе также достаточно много внимания уделено исследованию в рамках уголовного судопроизводства графических файлов, в том числе содержащих текст [4, с. 146-149; 13, с. 132-134; 14; 15, с. 255-256]. Однако авторы едины во мнении, что поиск текстовой информации по ключевым словам в массивах графической
СУ СК России по Иркутской области.
информации в автоматизированном режиме невозможен [7, с. 7; 14, с. 124] или крайне затруднителен [16, с. 91]. Основным доводом в пользу данной точки зрения являются особенности хранения и кодирования информации в графических файлах и, соответственно, отсутствие системы распознавания образов, обладающей достаточной производительной мощностью. Рекомендации по такого рода поиску сводятся к двухэтапной деятельности лица, осуществляющего:
-автоматизированный поиск изображений, который может подразумевать создание некоей базы данных изображений;
-последующее неавтоматизированное сравнение найденных изображений с образцом.
При поиске конкретного изображения (изображения конкретного документа) второй этап может быть упрощен предварительной селекцией файлов изображений по критерию сравнения — коэффициенту подобия. Результатом этого действия является получение массива графических файлов, содержимое которых имеет определенное сходство с образцом [13, с. 134].
Но в реальности задачи поиска ставятся шире, нежели поиск некоторого изображения. Так, при расследовании дел экономической направленности больший интерес представляют не столько текстовые документы, сколько их изображения, на которых, помимо текста, зафиксированы подписи физических лиц и оттиски печатей организации. При обнаружении такого документа следователем может быть сделан вывод не только о текстовом содержании гипотетического документа, но и о его реальном существовании, поскольку методы получения графического изображения в большинстве случаев предусматривают либо сканирование, либо фотографирование реального распечатанного документа. Доказательственное значение найденного файла с изображением документа будет значительно выше, чем значение файла, содержащего документ в текстовом виде. Так, в рамках расследования уголовного дела № 17253 по признакам преступления, предусмотренного ч. 2 ст. 199 УК РФ, по факту уклонения от уплаты налогов в ходе проведения судебной экспертизы экспертом помимо файлов, содержащих названия организаций и фамилий должностных лиц, было обнаружено 323 графических файла, содержащих изображения искомых слов. Среди обнаруженных графических файлов выявлены скан-копии подписанных договоров, факт наличия которых доказывал существование договорных отношений между контрагентами. Наличие же текста договора в файле формата *^ос таким доказательственным значением не обладает5.
Ввиду того что анализ контента графических файлов, содержащих текст, является процессом неавтоматизированным и в большей степени проводящимся с целью обнаружения изображения конкретного документа, данная проблема не рассматривается специалистами как задача контекстного поиска.
Тем не менее в современной науке под контекстным поиском подразумевается гораздо более широкое понятие, чем то, которое было приведено выше и применяется сегодня при поиске криминалистически значимой информации. Например, активно развиваются системы контекстного поиска речевых документов, основанные на фонемном транскрибировании распознанного текста [17, с. 70]. Разрабатываются также эффективные алгоритмы и методы контекстного поиска изображений [18; 19]. В частности, к описанным выше задачам обнаружения определенного текста в изображении ближе всего подходят методы, в основе которых лежит распознавание образов изображений. Эти методы позволяют проводить контекстный поиск изображений на логическом уровне абстракции, поскольку базируются на выделении отдельных объектов изображений. Данный подход лежит в основе алгоритмов распознавания изображений лиц [20-22], которые сегодня достаточно активно интегрируются в системы безопасности и динамично развиваются. Конечно, подобные решения имеют ряд актуальных проблем конституционного, процессуального и технического характера [23-25], поэтому говорить о них применительно к судебно-экспертной практике еще преждевременно.
Таким образом, современное положение дел с поиском фрагмента текста в графических файлах может быть охарактеризовано следующими тезисами:
по коэффициенту подобия, количество сканированных и сфотографированных изображений документов может достигать десятков тысяч.
Сегодня имеется как минимум два механизма решения упомянутого выше вопроса:
тенденции развития этого направления работы дают основания полагать, что со временем названные проблемы будут успешно решены.
В качестве средств контекстного поиска в сети Интернет могут использоваться различные инструменты. Наиболее распространены информационно-поисковые системы различных интернет-ресурсов (поисковые машины Yandex, Google, Rambler, Yahoo и др.). Они осуществляют отбор, индексирование и поиск информации на основе постоянно обновляемого индекса. Главным преимуществом данных систем является их доступность и нетребовательность в специальных познаниях. К недостатку же стоит отнести тот факт, что упомянутые выше информационно-поисковые системы не работают в так называемом теневом (глубоком) Интернете. Одной из таких теневых сетей, получивших в настоящее время наибольшее распространение, является сеть TOR (англ. The Onion Router — «луковичный» маршрутизатор — программное обеспечение для реализации анонимной маршрутизации). Сайты этой сети имеют домен .onion. Именно в указанной сети активно развиваются сегменты, связанные с незаконным распространением контента сексуального характера, с оборотом наркотических веществ, с оборотом компьютерной информации [26, с. 651].
Другим способом, позволяющим провести контекстный поиск в сети Интернет, является применение метапоисковых систем. Метапоисковые системы не имеют собственной базы данных и собственного поискового индекса и работают, посылая запросы одновременно на несколько поисковых систем, каталогов, в том числе в теневую часть Интернета. Такие системы в основном обладают достаточно развитым языком запросов. Это позволяет глубже детализировать и конкретизировать запросы по сравнению с обычными информационно-поисковыми системами [27, с. 633]. Метапоисковые системы могут различаться по функциональному предназначению: мониторинговые системы, экстракторы объектов, анализаторы социальных сетей и пр. Работа с ними требует специальных знаний не столько в области компьютерной техники, сколько в области информационной аналитики, так как основная цель применения таких инструментов контекстного поиска
заключается в анализе получаемой информации и формировании единой картины происходящего с целью предотвращения преступления и применения мер профилактического характера.
Подводя итог, можно сформулировать ряд выводов:
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ
Актуальные проблемы исследования компьютерных средств. — М. : ГУ ЭКЦ МВД России, 2002. — С. 88-96.
REFERENCES
l.Solovyov V.S. Crime in social networks (criminological research based on judicial practice materials). Kriminologicheskii zhurnal Baikal&skogo gosudarstvennogo universiteta ekonomiki i prava = Criminology Journal of Baikal National University of Economics and Law, 2016, vol. 10, no. 1, pp. 60-72. DOI: 10.17150/1996-7756.2016.10(1).60-72. (In Russian).
16. Zudin S.I. The general description of the technologies of expert analysis of computer facilities. Aktual&nye problemy issle-dovaniya komp&yuternykh sredstv [Topical Issues of Analyzing Computer Facilities]. Moscow, Expert Criminalistic Center of Russian Ministry of the Interior Publ., 2002, pp. 8