Спросить
Войти

НОВІ ПІДХОДИ ДО ЗАСТОСУВАННЯ РІЗНИХ МЕТОДІВ ЗНАХОДЖЕННЯ БАЗОВИХ МАС ПРИ КЛАСИФІКУВАННІ ГІПЕРСПЕКТРАЛЬНИХ КОСМІЧНИХ ЗОБРАЖЕНЬ

Автор: C. І. Альперт

https://orcid.org/0000-0002-7284-6502

УДК 528.06 С.1. АЛЬПЕРТ*

НОВ1 П1ДХОДИ ДО ЗАСТОСУВАННЯ Р1ЗНИХ МЕТОД1В ЗНАХОДЖЕННЯ БАЗОВИХ МАС ПРИ КЛАСИФ1КУВАНН1 Г1ПЕРСПЕКТРАЛЬНИХ КОСМ1ЧНИХ ЗОБРАЖЕНЬ

Науковий Центр аерокосмiчних дослiджень Землi 1ГН НАН Укратни, м. Ки!в, Украша

Анотаця. На даний час визначення базових мас залишаеться важливою задачею, яка впливае на остаточн результати класиф1кування. Загального тдходу для визначення базових мас не ¡снуе. У дашй робот1 були розглянут1 р1зт методи визначення базових мас. У статт1 описуеться новий метод класифтування г1перспектральних косм1чних зображень, який в1др1зняеться в1д в1домих розв&язюв однойменних задач особливим способом розбиття спектрального ознакового простору. Було проведено оптимизацию границь м1ж класовими интервалами на спектральних в1сях за допо-могою спещального функционала. Новий метод застосовуе теор1ю св1дчень Демпстера-Шейфера й визначае базов1 маси за допомогою частотного тдходу. Також у дамй статт1 був розглянутий новий тдх1д до знаходження базових мас з використанням в1дстат Махаланоб1са. Була наведена формула, яка показуе взаемозв &язок м1ж в1дстанню Махаланоб1са та базовими масами. Запропо-новано метод визначення базових мас 7з використанням нечтких множин та нечтких чисел. Було зауважено, що теор1я неч1тких множин використовуеться при невизначених та неточних даних. Також описано метод визначення базових мас 7з використанням центральних виб1рок. Зауважено, що для вибору центральних виб1рок застосовуються опукл1 оболонки. Пот1м визначаються базов1 маси з використанням вгдсташ м\\ж класиф!кованими даними та вибраними центральними вибгр-ками. Дал1 базов1 маси комб1нуються за правилом Демпстера, 7 отримуються остаточш базов1 маси. Було наголошено на тому, що складн гтотези теж розглядаються. Також проанал1зовано новий тдх1д до визначення базових мас 7з використанням в1дстат м1ж класиф1кованими даними та нормальним розподыом кожног характеристики для кожного еталонного класу. Описан7 методи отримання базових мас можуть бути застосоват при класифжувант г1перспектральних косм1чних зображень, в управлтю транспортом, при класифтуваню рослинност1, у клМчтй д1аг-ностищ, при анал1з1 ризиюв, розв&язанн тематичних завдань та при контрол1 якост1 води. Ключовi слова: базова маса, в1дстань Махаланоб1са, теор1я неч1тких множин, центральна виб1р-ка, класиф1кування зображень.

Аннотация. В настоящее время определение базовых масс остается важной задачей, которая влияет на окончательный результат классификации. Не существует общего подхода к определению базовых масс. В данной работе рассмотрены различные методы определения базовых масс. В статье описывается новый метод классификации гиперспектральных космических изображений, который отличается от решений одноименных задач особым способом разбиения спектрального признакового пространства. Было проведено оптимизацию границ между классовыми интервалами на спектральных осях с помощью специального функционала. Новый метод использует теорию свидетельств Демпстера-Шейфера и определяет базовые массы с помощью частотного метода. Также в статье рассматривается новый подход к нахождению базовых масс с помощью расстояния Махаланобиса. Была приведена формула, которая описывает связь между расстоянием Ма-халанобиса и базовими массами. Предложен метод определения базових масс с помощью нечетких множеств и нечетких чисел. Было отмечено, что теория нечетких множеств используется при наличии неопределенных и неточных данных. Также описан метод нахождения базових масс с использованием центральних выборок. Было отмечено, что выпуклые оболочки используются для выбора центральних выборок. Потом базовые массы комбинируются по правилу Демпстера для того, чтобы получить окончательные базовые массы. Отмечено, что сложные гипотезы тоже рассматриваются. Также был проанализирован новый подход к определению базових масс с использованием меры расстояния между классифицированными данными и нормальным распределением каждой характеристики для каждого эталонного класса. Описанные методы нахождения ба-зових масс могут быть использованы при классификации гиперспектральных космических изоб© Альперт С.1., 2020

1028-9763. Математичш машини i системи, 2020, № 1

ражений, в управлении транспортом, при классификации растительности, в клинической диагностике, при анализе рисков, решении тематических задач и при контроле качества воды. Ключевые слова: базовая масса, расстояние Махаланобиса, теория нечетких множеств, центральная выборка, классификация изображений.

Abstract. This paper provides a description of a certain computer equipment components which allow remotely gain unauthorized access to computers. These components are Intel Management Engine (Intel ME) and Intel AMT. Intel ME is an independent subsystem which is included in almost all Intel processor chips since 2008. The chip is always connected to a power source, so the subsystem continues to work even when the computer is turned off. Vulnerabilities were discovered in Intel AMT, thereafter many computers using Intel processors became available for remote and local intruders. The paper also describes Chinese microchips that have been implemented into Supermicro equipment. This equipment was supplied not only to US commercial organizations but to governmental as well. Supermicro Chinese microchips have the ability to edit the code stream that heads to the processor by inserting their own code, or else it can change the instructions order for the processor. The microchip can intercept communication security coding, as well as prevent the restoration of the security system as a whole. The paper also provides an overview for recent sensational vulnerabilities of Meltdown, Spectre and ZombieLoad in Intel and ARM processors that allows manipulating a computer in a varying degree. These vulnerabilities are similar to each other, they allow a malicious application to read any type of computer memory, including kernel. It became feasible thanks to a speculative code execution system. Both personal user data can be stolen, such as browser history, website content, passwords, or system data, and disk encryption keys. Security experts should take into account the points above, as in certain cases all these things could possibly turn into national scale problems, both financial and political.

DOI: 10.34121/1028-9763-2020-1-30-42

1. Вступ

Мета дано! роботи полягае в анал1з1 та nopiB^HHÍ нових пiдходiв до застосування рiзних методiв знаходження базових мас при виршенш задач класифшування супутникових зо-бражень. Розглядаеться новий метод класифшування, що включае в себе оптимiзацiю гра-ниць мiж класами при розбитп ознакового простору за допомогою спещального функщо-нала та знаходження базових мас за допомогою частотного тдходу. Описуеться метод знаходження базових мас, який застосовуеться при виршенш задач класифшування лiсiв та сшьськогосподарських територш, з використанням метрики Махаланобюа. Проводиться аналiз методiв знаходження базових мас iз використанням теорп неч^ких множин, оскшь-ки при розв&язанш задач класифшування ми часто маемо оперувати з неповною та супере-чливою шформащею [1]. Також розглядаеться метод знаходження базових мас iз використанням опуклих оболонок, який мае широке застосування у клшчнш дiагностицi, у монь торингу та аналiзi навколишнього середовища, у сферi управлшня транспортом, в аналiзi ризиюв, у задачах класифшування рослинност та мониторингу якост води. Описуеться та аналiзуеться метод знаходження базових мас iз використанням мiри вщсташ мiж кла-сифшованими та еталонними даними. Даний метод застосовуеться в задачах класифшу-вання рослинности

2. Новий метод оптим1зацн границь м1ж класами при розбитп ознакового простору та знаходження базових мас за допомогою частотного пщходу
2.1. Новий алгоритм оптим1зацн границь

Спочатку нам треба кожен клас представити у виглядi деяко! област (штервалу) у просто-рi спектральних ознак. Для цього ми проводимо розбиття ознакового простору. При фор-муванш даних областей (iнтервалiв) використовуються значення сигналiв пiкселiв навчально! вибiрки. Розмiрнiсть областi визначаеться числом зональних зображень, яю викорис-товуються для проведення процедури класифiкування. Меж сформованих iнтервалiв ви-значаються величинами сигналiв пiкселiв класу у спектральному канала Також слiд заува-жити, що побудованi iнтервали не перетинаються, але межують один з одним. Число кла-сiв Ь визначае загальну кшькють iнтервалiв у спектральному канала

Рисунок 1 - До визначення положения границь, що роздшяють класи на спектральшй в1с1

Введемо позначення: Щ - кiлькiсть елеменпв I -го класу, що знаходяться в штервалi мiж середшми значеннями сигналiв пiкселiв и к л та и к , ■

Вщповщно, /г+1 - кшькють елеменпв / +1 -го класу. Наша задача полягае в максип • ...

шзацп функцi0налу для iнтервалу мiж середнiми значеннями сигналiв пiкселiв

и та ^ /&-/+| з метою знаходження нових оптимальних границь м1ж 17к , та та. к.,л . Нехай п1 - кiлькiсть елементiв 1-го класу, п2 - кiлькiсть елементiв 2-го класу для штервалу мiж

йк1 та ик1 ^ Розраховуемо функцiонал У даному iнтервалi викидаемо крайнiй

елемент справа. Отримаемо новi значення п1 та п2 ■ Позначимо !х як п1 та п2 . Тодi

розраховуемо нове значення функцюнала —— ■ Рухаемося далi у напрямку справа нап2 +1

лiво в iнтервалi мiж значеннями и к,1 та и к,1+ 1 i викидаемо наступний крайнiй об&ект, який знаходиться найближче до право! границ (тобто, вже викидаемо два крайшх елементи

отрава). Знов розраховуемо новi значення кшькосл об,ектiв 1-го та 2-го клаав: п* та п2

1 п1

i нове значення функцюнала Щ —^-■ Продовжуемо дану процедуру, рухаючись справа

п2 +1

налiво в даному штервал^ поки не дшдемо до останнього елемента. Потiм порiвнюемо всi знайденi на попереднiх етапах значення функцюнала та обираемо його максимальне значення, яке i буде одними iз нових границь в iнтервалi мiж значеннями и к,1 та и ■

Тепер у даному iнтервалi рухаемося у протилежному напрямку, злiва направо, ана-логiчно викидаючи поступово елементи, розраховуючи новi значення кшькосл об&ектiв та вiдповiдно новi значення функцюнала. Полм обираемо знов максимальне значення даного функцюнала, яке i буде другою новою оптимальною границею для даного штервалу.

Тобто, штервал мiж значеннями ик,1 та йк, 1 розбито на субiнтервали. Два максимальних значення функцюнала визначають новi границi мiж середнiми значеннями сигналiв тксе-лiв йк,1 та йкм\\. Знайшовши двi новi границi, штервал буде розбиватися на 3 субштерва-ли, незалежно ввд кiлькостi клаав. При цьому в першому субiнтервалi будуть представни-ки 1-го класу, у другому субiнтервалi будуть представники вах класiв, у третьому субште-рвалi знаходяться представники 3-го класу. Далi проводимо аналогiчну процедуру розбит-тя на субiнтервали для наступного штервалу. Визначаемо базовi маси за допомогою частотного пщходу, а саме формули (1) для ycix субiнтервалiв, KpiM середшх, оскiльки для Bcix середнiх сyбiнтервалiв базова маса вiд складних ппотез завжди буде piBHa 1.

2.2. Частотний пщхщ обчислення базових мас для клаав

Припустимо, що у J -му iнтеpвaлi (облaстi) ми маемо Mj пiкселiв, при цьому Mi - це число пiкселiв класу, для якого даний штервал (область) е власним, а M 2 - загальне число пiкселiв шших клaсiв. Ощнка базово&: ймовipностi пiксельних об&ектiв у власному iнтеpвaлi вказаного класу визначаеться за такою формулою:

сумарна базова ймовipнiсть тксельних об&ектiв iнших клaсiв у цьому ж штерваш визнача-еться за такою формулою:

= (2) м;

Таку ж саму вищеописану процедуру проводимо з iншими спектральними каналами. Отримуемо нове розбиття ознакового простору з новими оптимiзовaними границями. Проводимо процедуру клaсифiкyвaння, використовуючи правило комбшацп Демпстера та поняття тгшстично&: ймовipностi [2-3].

2.3. Процедура класифжування

Припустимо, шксельний об&ект ТСп характер изуеться векторним сигналом U„ = (Mi„&M2„&-Mi„&-&MAT„) вже 3 урахуванням нового розбиття ознакового простору.

Крок 1. У кожному спектральному канал1 з новими оптшшзованими границями визначаеться субштервал, якому вщповщае певний сигнал Ыы шкселя Jl„ (к = 1-,2,...,К).

Крок 2. Визначаються iменa yсiх клaсiв об&ектiв, що знаходяться у кожному такому субштервал^ тсля чого отримуються значення базово&: ймовipностi об&ектiв даного сyбiн-тервалу.

Крок 3. Розраховуеться за допомогою правила Демпстера комбшоване значення мас для вах гiпотез.

Крок 4. Розраховуються пiгнiстичнi ймовipностi BetP для вах гiпотез. Крок 5. Проранджовуемо отримаш значення пiгнiстичних ймовipностей даних ппотез, дaлi визначаемо нaйбiльш iмовipний клас, до якого належить тксель, використовуючи кpитеpiй максимуму тгшстично&: ймовipностi.

Переваги даного методу: метод забирае небагато часу та досить нескладний для об-числень. Недолши: даний метод дае не досить точш результати при робот з неч^кими множинами i не може оперувати суперечливими даними за наявност великого значення коефщента конфлiктностi.

Псевдокод

S: number of spectral bands

K: number of classes and number of intervals

nk: number of elements of -class for interval between average values mk and mk+l nk+l: number of elements of k /-class for interval between average values mk and mk , For p: = 1 to S (йдемо по всiх спектральних каналах)

For r: = 1 to K (йдемо по всiх iнтеpвaлaх у кожному спектральному канал^ procedure delFirst;

a : array [1..N] of integer ;

i : integer ; {змшна I вводиться як шдекс масиву} res : real; begin Readln(„N = &, N); For i:=1 to (N-1) do a[i]:=a[i+1]; a[N]:=0;

res:=ln(n[i]/(n[i+1]+1))/ln(10); Writeln(res); end;

procedure delLast; var

a : array [1..N] of integer ;

i : integer ; {змшна I вводиться як шдекс масиву} res : real; begin For i:=(N-1) to 1 do a[i+1]:=a[i]; a[i]:=0;

res:=ln(n[i]/(n[i+1]+1))/ln(10); Writeln(res); end; begin delFirst; delLast; end.

Ц : number of functionals /&■ of interval between average values mk and mk+1 for right-to-left direction

function max(mas:array of functionals F ); begin

Ft :— mas[ 1]

for i &.= 1 to Lx do begin

if Fi < mas\\i\\ then Fi mas\\i\\ ; end;

max := R; end;

write ("we get a new first bound for interval between average values mk and mk+l for

right-to-left direction"); end.

L2 : number of functionals F* of interval between average values mk and mk+l for left-to-right direction

function max(mas:array of functionals F * );

F* := mas\\Y\\

for i := 1 to L2 do begin

if F* < mas\\i\\ then F* :— mas\\i\\; end;

тах:=Д ; end;

write ("we get a new second bound for interval between average values mk and mk+l for left-to- right direction"); end.

write ("we get new bounds for interval between average values mk and mk+l, so we divide

interval into K subintervals"); end. end. end.

K : number of subintervals

For p: = 1 to S (йдемо по Bcix спектральних каналах)

For j: = 1 to K * (йдемо по Bcix субштервалах у кожному штерваш кожного спектрального каналу) begin

writeln ("рахуемо базов1 маси ппотез: m (Ак),т (Ак+1), тр(Ак+2\\... для Bcix субштервалiв спектрального каналу, при цьому враховуемо, що в cереднix субштервалах кожного штервалу будуть представники вах клаciв, а базова маса вщ цих вcix складних гiпотез завжди буде рiвна 1");

readln (тр(Ак\\тр(Ак+1\\ тр(Ак+2),...);

end. end. end.

For i:= 1 to (S* do (йдемо no Bcix спектральних каналах) begin

writeln ("знаходимо новi базовi маси для вcix гiпотез, комбшуючи базовi маси cубi-нтервал1в даних спектральних канал1в за правилом Демпстера: т(Ак),т(Ак+1), т(Ак+2),...

readln ( т(Ак ), т(Ак+1 ), т(Ак+2 ),...);

end. begin

writeln ("шукаемо тгшстичну ймовiрнicть для вcix простих гшотез: BetP(Ak\\BetP(Ak+1\\BetP(Ak+2\\..."X

readln (BetP(Ak\\BetP(Ak+1\\ BetP(Ak+2\\...)-end.

3. Метод знаходження базових мас за допомогою розрахунку вщсташ Махаланобка до клас1в

Припустимо, що ми маемо багатоспектральний зшмок 0, який включае в себе К зональ-них зображень:

а = = (3)

Усi зональнi зображення мають однакове число пiкселiв N. к -те зональне зображення ^ можна представити у такому виглядi:

й = {*„«*}; п = 1,2,...,^, (4)

де ипк - р1вень сигналу п -го шкселя пп зонального зображення

Зауважимо, що один i той же тксель на рiзних зональних зображеннях мае рiзнi рiвнi сигналу, тобто повний сигнал пiкселя ип - це К -вимiрний вектор:

«, = {«*}; к = 1,2,...,К, (5)

ип <е нк, компонентами якого е значения (р1вш) цього сигналу на вюях спектрального простору Як (спектральних вюях).

Даний метод полягае в тому, щоб провести потксельну класифшащю багатоспек-трального зшмку С. Вщома загальна кшыасть клаав J. При цьому для кожного класу е достатня кшыасть реирезенпв у навчальшй виб1рщ Г2.

Спочатку вщкидаемо малоiнформативнi спектральнi канали методом оцшки кореляцii i отримуемо К найбшьш ефективних та iнформативних спектральних каналiв. Далi розглянемо послiдовнiсть розв&язку дано! задачi:

1. Беремо перше зональне зображення . Значення сигналiв пiкселiв на цьому зображеннi розташовуються на спектральнiй вiсi Використовуючи навчальну вибiрку О, знайдемо середш значення сигналiв пiкселiв для кожного iз класiв та побудуемо гранищ мiж класами на спектральнш вiсi, що розглядаеться. Гранищ мiж сумiжними класами бу-дуемо, використовуючи метод оптимiзацГi границь мiж класами при розбиттi ознакового

простору за допомогою максимiзацii функцюнала 1g-&-—, що описаний у Ьму пунктi.

пм+1

Таким чином, уздовж спектрально! вiсi було видiлено не тшьки два класи - перший та другий, але ще i додатковий змшаний клас, який був створений ткселями першого та другого клаав. Аналогiчним чином може з&явитися додатковий змiшаний клас мiж другим та трепм класами i т.д. Та ж сама процедура проводиться для уах клаав на першш спек-тральнiй вiсi. Потiм беремо другу спектральну вюь i проводимо аналопчну процедуру.

У результатi отримуемо у К Арному спектральному просторi областi iз сигналiв пiкселiв iз навчально! вибiрки: область сигналiв пiкселiв першого класу, другого i т.д., ще i змiшанi областi, що утворюються сигналами пiкселiв рiзних клаав (як перетини класiв). Кожну з таких областей можна розглядати як багатовимiрний паралелетпед, в якому знаходяться сигнали пiкселiв класу чи декшькох класiв.

2. Також слiд зазначити, що сигнал у будь-якш однш областi - це вектор з К скла-довими елементами. Кшьюсть таких сигналiв у довiльнiй обласп може бути - Q■ ^ сигнали утворюють множину випадкових сигналiв, для яко! можна обчислити коварiацiйну матрицю. При цьому коварiацiйнi матрицi розраховуються окремо для обласп з пiкселiв

кожного класу та для кожно! змшано! областi, яку утворюють пiкселi з двох чи бшьше класiв. Також для кожно! областi знаходимо центр тяжшня (середне значення). Ко-варiацiйна матриця для р -го класу буде квадратною. При цьому число рядюв та число

стовпчиюв дано! матриц буде дорiвнювати кiлькостi зональних зображень К .

81 Ри3А ■■■ РжА5кРг А8\\ 52 •• Р2кдАк

р , 8 ,8, р . 8 .8, ... 8

Г К Ик 2 к 2 I

2
3. Тепер, якщо взяти будь-яку довшьну точку А, яка описуеться вектором и* = (щ ,и1,...,и*.), то можемо розрахувати вщстань м1ж щею точкою та областю за допо-могою метрики Махаланобiса:

МЛР =

V? > Мр )Т, (7)

де // - математичне спод1вання р -го класу (р = 1,2,...,У), J - загальна кшыасть клаав,

Бр1 - обернена ковар1ащйна матриця для р -го класу.

4. Використовуючи знайдену метрику Махаланобюа, знаходимо базовi ймовiрностi (маси). Враховуючи, що вiдстань Махаланобiса приймае значення вщ "0" до нескшчен-носп, а значення ймовiрностей знаходяться в дiапазонi вiд "0" до "1", застосовуемо таке перетворення. Нехай у нас е деякий тксель, для якого треба визначити базову ймовiрнiсну масу. Припустимо, що даний тксель представлено у спектральному просторi деякою точкою А. Нам треба розрахувати вщстань МБ^ мiж щею точкою та центром тяжшня област

со. класу. Для цього спочатку обчислюемо вщстань Махаланобюа м1ж щею точкою та кожною з областей-клаав. Дал1 знаходимо середне значення з отриманих вщстаней Маха-ланобюа - МО. Пот1м вщстань МП] м1ж точкою А та областю со, класу перетворюемо у базову ймовiрнiсть точки А за такою формулою:

т( А) = 1--1 А — , (8)

де к - коефщент.

Пiсля нормалiзащi розраховуються тгшстичш ймовiрностi для кожно! iз областей-клаав. Потм пiкселю, який ми маемо класифшувати, надаеться той клас, для якого тгнютична ймовiрнiсть буде найбшьшою. Для даного пiкселя задача класифшування розв&язана. Далi переходимо до наступного ткселя i проводимо таку ж саму процедуру. Переваги даного методу: метод нескладний для обчислень i забирае небагато часу. Недолши: даний метод не пщходить при робот! з неч^кими множинами при наявносп не-визначено!, неповно! та неточно! шформацп [2-4].

4. Метод знаходження базових мас ¡з використанням теорн неч1тких множин

Досить часто при розв&язанш задач класифiкування ми маемо справу з неповною, неточною та суперечливою шформащею. Теорiя неч^ких множин дае змогу описувати, обробляти та встановлювати взаемозв&язки мiж неточними даними. Наведемо основнi по-няття та означення з теорн не1птких множин [5]. Нехай X - ушверсальна множина. Тод1 не1птка пщмножина А с X визначаеться за допомогою характеристично! функцп

Мл-XM ОД]. (9)

При цьому кожному елементу х е А надаеться дшсне значения характеристично! функци /1:(х) i3 штервалу [ОД]. Значения ,и ,(х) вказуе на вагу (grade of membership) елемента х у множит А. Нехай маемо не1птку множину Ac X та будь-яке дшсне число are [ОД]. Тод1 а - р1вень або а - зр1з, що вщиовщае множиш А, иозначаеться а A i е чiткою множиною:

aA = {x^X\\juA{x)>a}. (10)

Трикутне неч^ке число A визначасться через трiйку чисел [a, b, c]. Його характеристична функщя мае вигляд

(лА (х) =

х — а ,

-, а<х<Ь

Ъ — а

с — х

b < х <с

Центральний елемент описуеться за допомогою а - зр1зу таким чином:

«д. = {х: ма(х) > а,} = , ], (/ = 1,2,3,...,п), (12)

де а0 -1 > ах > а2 >... > ап = 0, а е [ОД]. Перший nidxid до знаходження базових мас

У даному випадку ми беремо штеграл вщ характеристично! функци Mi ж двома р1зними а - зр1зами, отримуемо базову масу aAj (а -зр1зу):

1upper

J MiA^d*

Ч"4) = —^f-• (13)

Другий nidxid до знаходження базових мас Базова маса визначаеться за формулою

т("А,)="< • (14)

аг-\\ (1 ~~ аг )

Третт niдxiд до знаходження базових мас

У третьому метод1 а - зр1з розглядаеться як штервал дов1ри з р1внем дов1ри: 1 - а. Базова маса визначаеться за формулою

1 — ос

mCAi)=& a& (15)

Наведен три методи знаходження базових мас мають таю переваги: використову-ються при розв&язанш задач класифшування за наявносп невизначено!, неточно! та непов-но! шформацп.

Основний недолiк даних методiв: наведена процедура знаходження базових мас не завжди е обгрунтованою, оскшьки нам вiдомий тiльки один параметр - трикутне неч^ке число, яке вказуе на максимальне, мшмальне та найбшьш вiрогiдне значення й визна-чаеться через характеристичну функщю.

5. Метод визначення базових мас, заснований на м1р1 в1дстан1 мпж класиф1кованими даними та еталонними даними

Даний метод базуеться на використанш мiри вiдстанi мiж класифiкованими та еталонними даними, тобто на вщсташ мiж класифiкованими об&ектами та нормальним розподшом кожно! характеристики для кожного еталонного класу. Цей метод використовуе класифшо-ваш данi для побудови нормального розподшу еталонних даних для кожно! характеристики. Базовi маси визначаються на основi мiри вiдстанi мiж класифiкованими даними та мо-деллю для кожно! характеристики для кожного еталонного класу [6]. Нехай ми маемо п клаав та N об&екпв. При цьому кожей клас мютить / об&ект1в. Також для кожного класу юнуе певне число характеристик —к. Припустимо, що ми з першого класу випадковим чином обираемо т об&ект1в та знаходимо середне значення ¡л й середне квадратичне вщхи-лення 8 для першо! характеристики для першого класу. Аналопчним чином з шших клаав обираемо т об&екпв та знаходимо середне значення й середне квадратичне вщхи-лення також для першо! характеристики. Потм будуемо графш нормального розподiлу для першо! характеристики для кожного класу. Аналопчно будуемо моделi нормального розподшу для вах iнших характеристик для вах класiв. Класифiкування проводиться таким чином. Обираемо випадковим чином об&ект, який треба класифшувати, з певними характеристиками та анашзуемо взаемозв&язок мiж цим об&ектом та нормальним розподшом кожно! характеристики кожного класу. Для цього спочатку знаходимо мiру вщсташ мiж класифшованими даними хг та нормальним розподiлом характеристики класу А :

де /л - середне значення нормального розподшу характеристики класу А, 8 - середне квадратичне (стандартне) вщхилення.

Функщя похибки обчислюеться таким чином:

де р\\_х\\ - функщя густини нормального розподшу характеристики класу А, яка обчи-слюеться таким чином:

Тепер обчислюемо мiру вщсташ й (А) як функщю похибки:

Отримане значення мiри вщсташ d ( A ) виражае CTyniHb вщхилення мiж класифшо-ваними даними x та моделлю нормального розподiлy певно&1 характеристики певного класу A.

Також слщ зазначити, що чим бшыпе значення м1ри вщсташ, тим менше ймов1р-шсть, з якою класифшоваш об&екти хг належать класу А. Маемо р( А ) = \\ — с!( А ) - ймовiрнiсть належностi об&ектiв x класу A. Значення мiри вщсташ d(A) виражае мiрy вщсташ мiж певною характеристикою класифiкованого об&екта та нормальним розподшом певно&1 характеристики у кожного класу. Шсля обчислення мiри вiдстанi d ( A ) обчислюемо ймовiрностi належностi класифiкованих об&екпв рiзним класам за певною характеристикою. Нормуемо отримаш ймовiрностi та отримуемо базовi маси. Аналогiчно знаходимо базовi маси належностi об&ектiв рiзним класам за iншими характеристиками. Використо-вуючи правило комбшацп Демпстера, отримуемо резyльтyючi базовi маси належностi об&екпв класам.

6. Метод визначення базових мас i3 використанням центральних виб1рок
1) Даний метод використовуе навчальнi данi для отримання центральних вибiрок, якi да-ють необхiдну шформащю для rinoTe3 [6-7]. Центральнi вибiрки, у свою чергу, викорис-товуються для знаходження базових мас. Центральна вибiрка - це множина даних, яю, вь дповiдно до характеристик, належать певному класу. Якщо у нас m класiв, то буде m центральних вибiрок. Центральнi вибiрки, якi вiдповiдають простим та складним гипотезам, отримуемо використовуючи метод к-середшх. При цьому центральнi вибiрки, якi мю-тять об&екти одного класу, використовуються всi, а i3 центральних вибiрок, якi мiстять об&екти рiзних класiв, обираються тiльки репрезентативш в залежностi вiд значення оптимального вщношення, яке отримуемо, використовуючи опу^ оболонки. Опукла оболонка - це множина даних, що належить вщомому класу. Або опукла оболонка-довжина опукло-го штервалу, що мютить множину точок, якi належать певному класу (для одновимiрного простору). У двовимiрному та тривимiрному просторах форма опуклих оболонок вимiрю-еться за допомогою площi та об&ему вщповщно.
2) Отримуемо опуюп оболонки, що вщповщають простим ппотезам i мютять об&екти одного класу: СН(Ст~), т е М. Отримуемо також опуюп оболонки, що вщповщають складним ппотезам. Нам треба вибрати репрезентативш виб1рки, яю вщповщають складним ппотезам: card(N) > 2, використовуючи опуюп оболонки та оптимальне вщношення. У цьому випадку ми розглядаемо подiбнiсть мiж простими опуклими оболонка-ми CH(Cm),m<EN, що входять у складш. Наприклад, центральна виб1рка

ci. be\\l (а Ф b. а ф0.Ьф 0), що вщповщае складшй ппотезц мютить об&екти, яю належать класам <х>а та соъ . У цьому випадку ощнюемо оптимальне вщношення Rab. Якщо опукл1 оболонки CH(C) та CH (Cb) перетинаються, то це означае, що серед даних у навчаль-шй виб1рщ переважае бшьше под1бшсть, шж протир1ччя. При цьому оптимальне вщно-шення Rab =1. Якщо опукл1 оболонки СН(Са) та СН(СЪ) не перетинаються, то у цьому випадку оптимальне вщношення знаходиться за формулою

CHiC ) + CH(Ch ) = С*(С.+С.) • <20>

де СН(Са ) - опукла оболонка, що мютить точки i3 класу соа, СН(СЬ) - опукла оболонка, що мютить точки з класу coh, тобто СН(Са) та СН(СЬ) - це довжини штервал1в, до

яких належать точки з клаа в соа та соъ вщповщно, СН(Са + Съ ) - самий короткий непе-рервний iнтервал, що мiстить CH() та CH(^) . Оптимальне вiдношення КаЬ вира-жае иод1бшсть м1ж оиуклими оболонками. Для складних пиотез, коли N сА/, сагсЛ(Ы)> 2, встановлюемо иорогове значения . Якщо оптимальне вщ-ношення /^д > М7 , то розглядаемо дану складну пиотезу та вщиовщну !й центральну ви-б1рку. В шшому випадку, якщо < В^, то складш пиотези та вщповщш ш центральш вибiрки, чие оптимальне вщношення менше встановленого порогового значення, вщкида-емо.

3) Обчислюемо вщстань мiж класифiкованими об&ектами та вибраними центральними вибiрками.
4) Обчислюемо базовi маси за формулами

т\\{СМ1}) = ащ<р(Л;), (21)

т&«С1}) = 1-Х (22)

2 = 1

де О < ам < 1 - константа, яка надае вагу монотонно сиадаючш функцп ср , для якоТ вико-нуеться: <р(0) = 1 та

В експоненцiальнiй формi:

де ум - константа, що вщповщае центральнш виб1рщ См .

5) Комбiнуемо базовi маси за правилом Демпстера.
6) Обчислюемо тгшстичш ймовiрностi та визначаемо належшсть об&екта до певного класу.

Переваги данного методу: базовi маси обчислюються для всiх характеристик; е мо-жливють уникнути сильних протир1ч в отриманих базових масах, так як ¡мов1рносп нада-ються як 1 простим, так 1 складним ппотезам; базова маса надаеться множиш О, завдяки чому тiльки достовiрнi свiдчення приймаються за простi ппотези; оптимальне вiдношення показуе подiбнiсть мiж простими гiпотезами, що входять у складш. Чим вище обране нами порогове значення R , тим бшьше ми вiдкидаемо вибiрки, що вiдповiдають складним ппотезам iз високим ступенем внутрiшнього протирiччя; даний метод дае можливiсть зменшити невизначенiсть за допомогою вибору репрезентативних центральних вибiрок; завдяки тому, що властивосп опуклостi зберiгаються не тшьки в одновимiрному, а також i в багатовимiрному випадку, даний метод можна застосовувати до багатовимiрних моделей, що описують характеристики об&екта; для отримання точних результат даний метод не потребуе наявносп велико! кшькосп навчальних даних.

7. Висновки

У данш роботi було розглянуто новi пiдходи до застосування рiзних методiв знаходження базових мас. Розглянуто метод класифшування, який вiдрiзняеться вщ вiдомих методiв ви-рiшення однойменних задач особливим способом розбиття спектрального ознакового простору з метою представлення клаав областями у просторi спектральних ознак. При цьому показано, що числове значення ознаки класу у кожному спектральному каналi розташовуеться у деякому штервал^ границi якого визначаються за допомогою спецiального функць онала. Також було описано метод знаходження базових мас за допомогою метрики Маха-ланобiса. Для будь-яко! точки за допомогою метрики Махаланобюа обчислюються вiдстанi до кожно! з областей, а потсм цi вщсташ перераховуються у базовi ймовiрностi. У статп було проведено аналiз методу знаходження базових мас iз використанням теори нечiтких множин, оскiльки при розв&язанш задач класифiкування ми часто маемо оперувати з непо-вними, неточними та суперечливими даними. Розглядався метод знаходження базових мас iз використанням опуклих оболонок та метод знаходження базових мас iз використанням мiри вщсташ мiж класифiкованими та еталонними даними. Запропоноваш методи знаходження базових мас можуть бути використаш при виршенш актуальних природоресурс-них задач, таких як класифшування рослинностi, пошук корисних копалин, класифшуван-ня лiсiв, сiльськогосподарських земель, у медичнш дiагностицi, у сферi управлшня транспортом, контролю якостi води та мошторингу навколишнього середовища [7].

СПИСОК ДЖЕРЕЛ

1. Beynon M.J., Curry B., Morgan P. The Dempster-Shafer theory of evidence: an alternative approach to multicriteria decision modeling. Omega: Int. Journal of Management Science. 2000. Vol. 28. N 1. P. 3750.
2. Smets P., Henrion M., Shachter R.D., Kanal L.N., Lemmer J. F. Constructing the pignistic probability function in a context of uncertainty. Uncertainty in Artificial Intelligence. 1990. Vol. 5. P. 29-40.
3. Shafer G. A Mathematical Theory of Evidence. Princeton: Princeton University Press, 1976. 297 р.
4. Альперт C.I. Пор1вняння нового удосконаленого шдходу комбшування суперечливих даних з правилом Ягера Украгнський журнал дистанщйного зондування Земл1. 2018. № 17. С. 14-17. URL: https://ujrs.org.ua/ujrs.
5. Dutta P., Boruah H., Ali T. Fuzzy arithmetic with and without using a-cut method: a comparative study.

International Journal of Latest trends in Computing. 2011. Vol. 2, N 1. P. 99-108.

6. Jiang W., Duanmu D., Fan X., Deng Y. A new method to determine basic probability assignment under fuzzy environment. International Conference on Systems and Informatics (ICSAI2012). P. 758-762.
7. Zhang C., Hu Y., Chan F.T.S., Sadiq R., Deng Y. A new method to determine basic probability assignment using core samples. Knowledge-based Systems. 2014. Vol. 69. P. 140-149.

Стаття над1йшла до редакцп 19.09.2019

базова маса відстань Махаланобіса теорія нечітких множин центральна вибірка класифікування зображень vulnerability of computer systems information security intel me intel amt supermicro mi- crochip
Другие работы в данной теме:
Контакты
Обратная связь
support@uchimsya.com
Учимся
Общая информация
Разделы
Тесты