|
Ðàññìîòðèì
çàäà÷è ïðåäñêàçàíèÿ
ýëåìåíòîâ â
äâóìåðíîé òàáëèöå
òèïà "îáúåêò-ñâîéñòâî"
, ñòðîêè â
êîòîðîé ai (i=1,2,..,m)
îïèñûâàþò
m îáúåêòîâ, à
ñòîëáöû xj (j=1,2..,n) ñîîòâåòñòâóþò
n ñâîéñòâàì
(õàðàêòåðèñòèêàì)
ýòèõ îáúåêòîâ.
Ïðåäñêàçûâàåìûå ýëåìåíòû (b) â òàáëèöå ìîãóò ðàñïîëàãàòüñÿ ïî-ðàçíîìó.  çàâèñèìîñòè îò ýòîãî âûäåëèì òðè ÑÅÌÅÉÑÒÂÀ çàäà÷: 1) âñå ýëåìåíòû bi0 ðàñïîëîæåíû â îäíîì ñòîëáöå; 2) âñå ýëåìåíòû bj0 ðàñïîëîæåíû â îäíîé ñòðîêå; 3) ýëåìåíòû bij0 ïðèíàäëåæàò ðàçíûì ñòîëáöàì è ñòðîêàì.  êàæäîì ñåìåéñòâå áóäåì âûäåëÿòü ÊËÀÑÑÛ çàäà÷ â çàâèñèìîñòè îò òîãî, êàêîå êîëè÷åñòâî (q) ýëåìåíòîâ íóæíî ïðåäñêàçûâàòü. Ïåðâîå ñåìåéñòâî ïî ýòîé õàðàêòåðèñòèêå áóäåò èìåòü òðè êëàññà çàäà÷: 1.1) ïðåäñêàçûâàåòñÿ îäèí ýëåìåíò ññòîëáöà (q = 1) ; 1.2) ïðåäñêàçûâàåòñÿ ñðàçó íåñêîëüêî ýëåìåíòîâ (1 < q < m) ; 1.3) ïðåäñêàçûâàþòñÿ ñðàçó âñå ýëåìåíòû ñòîëáöà (q = m) . Àíàëîãè÷íûì ñïîñîáîì âûäåëèì êëàññû çàäà÷ âî âòîðîì ñåìåéñòâå: 2.1) q =1 ; 2.2) 1 < q < n ; 2.3) q = n .  òðåòüåì ñåìåéñòâå âûäåëÿåòñÿ äâà êëàññà çàäà÷: 3.2) 1< q < m*n ; 3.3) q = m*n  êàæäîì èç ýòèõ âîñüìè êëàññîâ çàäà÷ áóäåì ðàçëè÷àòü ÒÈÏÛ çàäà÷ â ñîîòâåòñòâèå ñî øêàëàìè, â êîòîðûõ èçìåðÿþòñÿ çíà÷åíèÿ ïðåäñêàçûâàåìûõ ýëåìåíòîâ. Áóäåì ðàçëè÷àòü òðè ãðóïïû øêàë: íàèìåíîâàíèé (Í), ïîðÿäêà (Ï) è "êîëè÷åñòâåííûå" (Ê). Ñèòóàöèþ, ïðè êîòîðîé ïðåäñêàçûâàþòñÿ ðàçíîòèïíûå ýëåìåíòû îáîçíà÷èì ñèìâîëîì (Ð). Îïèñàííàÿ êëàññèôèêàöèÿ çàäà÷ àíàëèçà äàííûõ ïðèâåäåíà â Òàáëèöå 1.
Òàáëèöà 1. Ïðèâåäåì ïðèìåðû íåêîòîðûõ ðàñïðîñòðàíåííûõ òèïîâ çàäà÷ ïðåäñêàçàíèÿ. Çàäà÷à 1.1.Í ñîñòîèò â ïðåäñêàçàíèè îäíîãî ýëåìåíòà â ñòîëáöå, èçìåðåííîì â øêàëå íàèìåíîâàíèé.  ýòîì îáû÷íî ñîñòîèò çàäà÷à ðàñïîçíàâàíèÿ îáðàçîâ: óêàçàòü èìÿ îáðàçà (êëàññà), êîòîðîìó ïðèíàäëåæèò íåêîòîðûé íîâûé îáúåêò b (îïðåäåëèòü òèï çàáîëåâàíèÿ, ïðåäñêàçàòü íàëè÷èå èëè îòñóòñòâèå íåôòè è ïð.).  çàäà÷å 1.1.Ï âñå îáúåêòû óïîðÿäî÷åíû ïî öåëåâîìó ñâîéñòâó õ0 è òðåáóåòñÿ îïðåäåëèòü ìåñòî íîâîãî îáúåêòà b â ýòîì ïîðÿäêå (íàïðèìåð, ïðåäñêàçàòü, ÷òî íåôòè â ìåñòîðîæäåíèè b áîëüøå, ÷åì â ài, íî ìåíüøå, ÷åì â ài+1).  ñëó÷àå 1.1.Ê íóæíî óêàçàòü êîëè÷åñòâåííóþ õàðàêòåðèñòèêó õ0 îáúåêòà b (íàïðèìåð, ïðåäñêàçàòü çàïàñû íåôòè â ìèëëèîíàõ òîíí). Åñëè îáúåêòû â òàáëèöå óïîðÿäî÷åíû ïî âðåìåíè, òî çàäà÷à 1.1.Ê ïîçâîëÿåò ïðîãíîçèðîâàòü çíà÷åíèå ñâîéñòâ îáúåêòîâ â áóäóùåì. Ïîõîæèå ïî ñìûñëó çàäà÷è ñîñòàâëÿþò êëàññ 1.2. Òîëüêî çäåñü íóæíî ïðèíèìàòü ðåøåíèå ñðàçó î íåñêîëüêèõ ýëåìåíòàõ: ðàñïîçíàòü q îáúåêòîâ (òèï 1.2.Í), îïðåäåëèòü ïîðÿäêîâûå ïîçèöèè ãðóïïû îáúåêòîâ (òèï 1.2.Ï) èëè îöåíèòü êîëè÷åñòâåííóþ õàðàêòåðèñòèêó õ0 ñðàçó äëÿ q îáúåêòîâ (1.2.Ê). Âàæíîå çíà÷åíèå èìåþò çàäà÷è êëàññà 1.3. Ðàçäåëèòü îáúåêòû ïî ïîõîæåñòè èõ ñâîéñòâ, ò.å. óñòàíîâèòü íåêîòîðóþ èõ êëàññèôèêàöèþ, çíà÷èò ñôîðìèðîâàòü íåêîòîðûé íîâûé ñòîëáåö õ0, èçìåðÿåìûé â øêàëå íàèìåíîâàíèé (çàäà÷à òèïà 1.3.Í). ×àñòî åå íàçûâàþò çàäà÷åé àâòîìàòè÷åñêîé êëàññèôèêàöèè èëè òàêñîíîìèè. Ïðè ýêñïåðòíîì îöåíèâàíèè m îáúåròîâ ñ ó÷àñòèåì n ýêñïåðòîâ òðåáóåòñÿ îïðåäåëèòü èòîãîâóþ îöåíêó ëèáî â øêàëå ïîðÿäêà (òîãäà ýòî çàäà÷à 1.3.Ï), ëèáî â áîëåå ñèëüíîé øêàëå, íàïðèìåð, â ïðîöåíòàõ (çàäà÷à òèïà 1.3.Ê). Ñ çàäà÷àìè âòîðîãî ñåìåéñòâà ñòàëêèâàþòñÿ , êîãäà íóæíî, íàïðèìåð, îöåíèâàòü èíôîðìàòèâíîñòü ñâîéñòâ, ïðåäñòàâëåííûõ â òàáëèöå. Åñëè èìåþùèåñÿ ñâîéñòâà ïðåäâàðèòåëüíî ðàçäåëåíû íà êëàññû "èíôîðìàòèâíûå" è "íåèíôîðìàòèâíûå", òî ïðè íåîáõîäèìîñòè îïðåäåëåíèÿ, ê êàêîìó èõ ýòèõ êëàññîâ ñëåäóåò îòíåñòè íåêîòîðîå íîâîå ñâîéñòâî, ìû èìååì äåëî ñ çàäà÷åé òèïà 2.1.Í. Åñëè òðåáóåòñÿ óêàçàòü ïîðÿäêîâîå ìåñòî íîâîãî ñâîéñòâà â ïðåäâàðèòåëüíî óïîðÿäî÷åííîì íàáîðå ñâîéñòâ, òî ðåøàåòñÿ çàäà÷à 2.1.Ï. À åñëè òðåáóåòñÿ îöåíèòü èíôîðìàòèâíîñòü ñâîéñòâà b â áèòàõ, òî èìååò ìåñòî çàäà÷à 3.1.Ê. Äëÿ ãðóïïû ñâîéñòâ â ýòîì êëàññå ôîðìóëèðóþòñÿ çàäà÷è 2.2.Í, 2.2.Ï è 2.2.Ê. Î÷åâèäíà èíòåðïðåòàöèÿ çàäà÷ îöåíêè âñåé ñîâîêóïíîñòè ñâîéñòâ ñðàçó (çàäà÷ òèïà 2.3.Í, 2.3.Ï è 2.3.Ê). Ïðåäñòàâèì ñåáå òàáëèöó ñ ïðîáåëàìè â ðàçíûõ ñòîëáöàõ è ñòðîêàõ. Äëÿ ïðåäñêàçàíèÿ çíà÷åíèé ïðîïóùåííûõ ýëåìåíòîâ ïðèõîäèòñÿ ðåøàòü çàäà÷è ðàçíûõ òèïîâ èç êëàññà 3.2, â òîì ÷èñëå è çàäà÷ó ïðåäñêàçàíèÿ ðàçíîòèïíûõ ýëåìåíòîâ 3.2.Ð. Íàêîíåö, êëàññ 3.3. îõâàòûâàåò çàäà÷è ãåíåðàöèè òàáëèö ñ çàäàííûìè ñâîéñòâàìè: òåñòîâûõ òàáëèö äëÿ ïðîâåðêè ïðîãðàìì ðàñïîçíàâàíèÿ îáðàçîâ, òàáëèö ñëó÷àéíûõ ÷èñåë è ò.ï.  çàâèñèìîñòè îò òðåáóåìîãî òèïà øêàë áóäóò èìåòü ìåñòî çàäà÷è òèïà 3.3.Í, 3.3.Ï, 3.3.Ê èëè 3.3.Ð. Íå âñå îïèñàííûå òèïû çàäà÷ îäèíàêîâî õîðîøî èçó÷åíû. íåêîòîðûå èìåþò äàâíþþ èñòîðèþ, øèðîêî èçâåñòíû, èìåþò õîðîøî îòðàáîòàííûå àëãîðèòìû è ïðîãðàììû äëÿ èõ ðåøåíèÿ, êîòîðûå ïðèìåíÿþòñÿ â ðàçíûõ ïðèêëàäíûõ îáëàñòÿõ. Äðóãèå èçâåñòíû ìåíüøå, íî ïîíÿòíû è èíîãäà èñïîëüçóþòñÿ. Åñòü è òàêèå, êîòîðûå ïîêà ÿñíî íå ôîðìóëèðîâàëèñü è èíòåðïðåòàöèÿ êîòîðûõ âûçûâàåò çàòðóäíåíèÿ.  äàííîì ïàêåòå ïðåäñòàâëåíû ìåòîäû ðåøåíèÿ çàäà÷ òàêèõ òèïîâ: òàêñîíîìèÿ (1.3.Í), âûáîð ñèñòåìû èíôîðìàòèâíûõ ïðèçíàêîâ 2.3.Í), ðàñïîçíàâàíèÿ îáðàçîâ (1.1.Í, 1.2.Í), çàïîëíåíèÿ ïðîáåëîâ (3.2.Í, 3.2.Ï, 3.2.Ê), ïðîãíîçèðîâàíèÿ äèíàìè÷åñêèõ îáúåêòîâ (1.1.Ê). |