5 ZAKLJUČIVANJE I RASUĐIVANJE
137
5 ZAKLJUČIVANJE I RASUĐIVANJE
Zaključivanje (engl. Inference)
je proces dobivanja novog znanja na temelju postojećeg znanja
(poznatih činjenica) i važećih aksioma u jednom koraku. Možda ga najbolje definira filozof Imanuel Kant
(1724. 1804.) koji kaže da je zaključivanje proces izvođenja jednog stava iz jednog ili više drugih
stavova. Zaključivanje je pojedinačni korak kod kompleksnijeg misaonog procesa kojeg nazivamo
rasuđivanje.
Rasuđivanje ili rezoniranje (engl. Reasoning)
je sustavno zaključivanje na temelju opaženih
činjenica i/ili odgovarajućih pretpostavki, najčešće u više koraka zaključivanja. Rasuđivanje je najviši
misaoni proces usko povezan s inteligencijom.
Pogledajmo primjer rješavanja problema dvaju vrčeva sa slike 2-1. Zaključivanje se u svakom
pojedinom koraku provodi na način da na temelju trenutnog stanja napunjenosti vrčeva ustanovimo koja
se pravila mogu primijeniti, te nakon toga primijenimo odgovarajuće pravilo. To je bio primjer primjene
osnovnog pravila logičkog zaključivanja modus ponens. Rasuđivanje bi bio cjeloviti proces rješenja
problema, traženje puta od početnog stanja do nekog od ciljnih stanja na sustavni način, na primjer
primjenom širinskog pretraživanja, kako smo i ilustrirali u opisu rješavanja problema.
Inteligentniji ljudi uspješnije rasuđuju i uče iz novih situacija. Autori navode više različitih načina
ljudskog rasuđivanja, kao što su deduktivno rasuđivanje, induktivno rasuđivanje, abduktivno
rasuđivanje, rasuđivanje na temelju analogija i intuitivno rasuđivanje, a nama je posebno značajno
automatizirano rasuđivanje koje provodi stroj računalo koristeći formalni program koji oponaša neke
od postupaka rasuđivanja.
Deduktivno rasuđivanje (engl. Deductive Reasoning)
je rasuđivanje o pojedinačnim
slučajevima na temelju općih pravila poštujući pravila ispravnog zaključivanja. Na temelju ulaznih
premisa koje su istinite donosimo istinit zaključak. Deduktivno zaključivanje uvodi Aristotel u 4. st. p.
n. e., a njegov tipičan primjer modus ponens, koji smo već puno puta spominjali u spomen na
Aristotelovog učitelja Sokrata, glasi:
Svi su ljudi smrtni. Sokrat je čovjek. !
81
Sokrat je smrtan.
81
Simbol naziva se turnstilei u logici označava sintaktičku posljedicu. Ako imamo A B to znači da se B može
dokazati iz A ako koristimo neki formalni logički sustav. S druge strane simbol ⊨#naziva se double turnstile (dupli
Rasuđivanje je kompleksni misaoni proces koji se sastoji od više koraka zaključivanja
kod kojih, na temelju poznatih č injenica i važećih aksioma, dolazimo do novog znanja
čiju smo istinitost izveli na temelju istinitosti onoga što smo već znali. Automatsko
zaključivanje i rasuđivanje neizostavni je dio umjetne inteligencije, a kako se provodi u
različitim logičkim sustavima, opisuje ovo poglavlje.
5 ZAKLJUČIVANJE I RASUĐIVANJE
138
U deduktivno zaključivanje spadaju i modus tollens:
Ako je Micika kokoš, onda je ona ptica. Micika nije kokoš. ! Micika nije ptica.
i silogističko zaključivanje:
Svi su ljudi smrtni. Svi su Grci ljudi. ! Svi su Grci smrtni.
Induktivno rasuđivanje (engl. Inductive Reasoning) je rasuđivanje o općem pravilu na temelju
pojedinačnih slučajeva. Induktivno rasuđivanje nije uvijek valjano, pa zaključak može biti lažan, iako su
premise istinite. Induktivno se zaključivanje također u određenoj mjeri pripisuje Aristotelu, ali ga u
modernu filozofiju uvodi filozof Francis Bacon (1561. 1626.).
Kod deduktivnog zaključivanja na temelju implikacije: Ako je A istinito onda su i B i
C istiniti. i ulazne tvrdnje A je istinito. zaključili bismo B i C je istinito., dok
bi kod induktivnog zaključivanja postupak bio obrnut: B i C je istinito, pa onda i A mora
biti istinito.. Međutim, ova tvrdnja ne mora uvijek biti istinita pa bi primjerenija tvrdnja bila: B
i C je istinito, pa onda očekujemo da i A bude istinito.. Standardni primjer koji se
obično spominje je:
Svi labudovi koje smo vidjeli su bijeli. ! Na temelju toga zaključujemo da
su svi labudovi bijeli.
A ispravan zaključak bi bio: Na temelju toga očekujemo da su svi labudovi bijeli.,
zato što možda u budućnosti naiđemo i na nekog labuda koji nije bijele boje. Prvo zaključivanje spada u
jednostavnu indukciju, a osim nje postoje i drugi tipovi induktivnog zaključivanja, na primjer statistički
silogizam:
90% gimnazijalaca upisuje fakultet. Mate je završio Gimnaziju.
! Mate će se upisati na fakultet.
koji ne mora nužno biti istinit. Pravilni zaključak bi bio:
Očekujemo da će se Mate upisati na fakultet.
Abduktivno rasuđivanje (engl. Abductive Reasoning)
je ono kod kojeg nismo sigurni jesu li
premise istinite, već vjerujemo da su istinite, pa tako i za zaključak samo možemo vjerovati da je istinit.
Zaključku se obično dodaju atributi najbolji dostupan ili najvjerojatniji. Abduktivno zaključivanje
uvodi američki filozof Charles Sanders Peirce (1839. 1914.). Možemo slobodno kazati da se u
svakodnevnom životu često naslanjamo na abduktivno zaključivanje i rasuđivanje, a ono je bilo i jedan
od temeljnih načina zaključivanja poznatog literarnog detektiva Sherlocka Holmesa kojeg spominjemo
i u sljedećem poglavlju. Na primjer: Holmes je primijetio na prstu čovjeka svjetliju prugu i zaključio da
je čovjek bio oženjen, ali je skinuo vjenčani prsten.ili Holmes je primijetio da otisci vode u smjeru ograde
i zaključio da je lopov pobjegao preko ograde, a ne kroz dvorišna vrata.. I u jednom i u drugom slučaju
radi se o abduktivnom zaključivanju, zaključivanju koje se ne temelji na pouzdano provjerenim, istinitim
činjenicama, već na pretpostavkama, iako je naravno Sherlock Holmes uvijek u pravu. Vjerojatnosno
zaključivanje temeljeno na Bayesovom teoremu je također tipičan primjer abduktivnog zaključivanja, a
ovdje možemo uključiti i neizrazito zaključivanje, u biti bilo koje zaključivanje provedeno u situaciji
neizvjesnosti ili nesigurnosti. Često se koristi u ekspertnim sustavima, pa je primjerice jedan od prvih
ekspertnih sustava medicinske dijagnostike MYCIN koristio kod donošenja zaključaka mjeru
vjerovanjai mjeru nevjerovanja (engl. Measure of Belief i Measure of Disbelief), pa možemo smatrati
da je i njegovo rasuđivanje bilo abduktivno.
turnstile) i označava semantičku posljedicu. Ako imamo A#⊨#B to znači da je B istinit, ako je A istinit.# dolazi od
pojma istinski uzrokujeili povlači za sobom, a ⊨#od pojma istinski jednakoili implicira. A# B znači da B
formalno slijedi iz A, a A #B da je B logička posljedica od A, što znači da tablica istinitosti od A koji može biti i
složena logička tvrdnja je identična tablici istinitosti od B koji također može biti složena logička tvrdnja. U desna
strana formalno slijedi iz lijeve.
5 ZAKLJUČIVANJE I RASUĐIVANJE
139
Rasuđivanje na temelju analogija (engl. Analogical Reasoning)
polazi od premisa koje govore
o sličnosti članova unutar klase, pa ako jedan član klase ima neko svojstvo, onda ga vjerojatno imaju i
drugi članovi klasa. Primjer može biti:
Sokrat je čovjek i smrtan. Platon je čovjek. ! Platon je smrtan.
Ovo je varijanta induktivnog rasuđivanja s pojedinca na pojedinca, pa je zbog toga i slabije. Kod
induktivnog se zaključivanja kod rasuđivanja koristi veliki broj primjera, a kod rasuđivanja na temelju
analogija samo jedan, pa često vodi krivom zaključku. Na primjer:
Sokrat je smrtan i muško. Kleopatra je smrtna. ! Kleopatra je muško.
Intuitivno rasuđivanje (engl. Intuitive Reasoning)
svojstveno je ljudima i ne može se prikazati
algoritmom. Temelji se na intuiciji, sudovima koje um sam stvara na podsvjesnoj bazi. Detaljni
mehanizmi nam nisu poznati, samo znamo da se zaključci donose na temelju osjećaja”, a ne na temelju
racionalnog razmišljanja. Kako nema znanstvenog utemeljenja, intuicija se najčešće shvaća olako, iako
je zabilježeno da je odigrala značajnu ulogu u povijesti znanstvenih otkrića. Međutim, kako se ne može
automatizirati, nije značajna za umjetnu inteligenciju.
Automatizirano rasuđivanje (engl. Automated Reasoning)
nije posebna vrsta rasuđivanja, već
područje umjetne inteligencije i računarskih znanosti koje se bavi razumijevanjem postupaka
rasuđivanja i njihovog prebacivanja u algoritamski i računalni oblik, kako bi računalo moglo samo
provoditi zaključivanje i rasuđivanje. Pojavljuje se koncem 50-ih godina pojavom sustava za
automatizirano dokazivanje teorema (engl. ATP Automated Theorem Proving) ili automatizirane
dedukcije (engl. AD Automated Deduction), a danas je sastavni dio mehanizma za zaključivanje
(engl. Inference Engine)
sustava umjetne inteligencije kod kojeg se na temelju ulaznih podataka i znanja
pohranjenog u bazi znanja, slijedom zaključivanja po principima ulančavanja unaprijed ili unatrag traži
rješenje problema.
U nastavku ovoga poglavlja bavimo se različitim postupcima logičkog zaključivanja i rasuđivanja
temeljenog kako na klasičnoj tako i na vjerojatnosnoj i neizrazitoj logici.
5.1 Logičko zaključ ivanje i rasuđivanje
Jedna od osobina inteligentnih bića je usklađenost sa zakonima logike i mogućnost logičkog
zaključivanja i rasuđivanja. Ponašanje entiteta koje nije u skladu s logikom ne smatramo inteligentnim.
Logikom se bave filozofija i matematika. Filozofija se bavi proučavanjem apsolutnih istinitosti i
metodologijama provjere valjanosti, a matematika daje formalni jezik za izražavanje rečenica te postupke
za zaključivanje i rasuđivanje. Logičko zaključivanje i rasuđivanje prije svega se temelji na teoriji
dokaza koja definira mehanizme kojima izvodimo zaključke iz različitih poznatih ulaznih premisa
(pretpostavki ili propozicija). Umjetna inteligencija koristi matematičku logiku kao alat.
U umjetnoj inteligenciji, računalni entitet koji izvodi zaključivanje temeljeno na logici naziva se
logički agent. Logički agent je računalna implementacija znanja i postupaka rasuđivanja koji rješava
problem neke domene problema.
Logički agent je agent temeljen na znanju. To znači da je centralni dio njegove implementacije
baza znanja. Znanje o domeni problema prikuplja se u bazu znanja. Baza znanja sastoji se od zapisa
(rečenica) izraženih formalnim jezikom, koje se koriste u donošenju zaključaka. Rečenice se izražavaju
u jeziku za predstavljanje znanja. Znanje agenta temeljenog na znanju je uvijek ograničeno brojem
činjenica.
Standardni zadaci koje mora implementirati agent temeljen na znanju zovu se TELL i ASK.
TELL ili kazatije zadatak unošenja nove informacije. TELL zadatak zadužen je za dodavanje
rečenice u bazu znanja na način da je poveže s već postojećim znanjem.
ASK ili upitje zadatak dobivanja postojeće informacije iz baze znanja. ASK zadatak utjelovljuje
ispitivanje baze znanja. Oba zadatka zahtijevaju pokretanje postupka za zaključivanje.
5 ZAKLJUČIVANJE I RASUĐIVANJE
140
Tipično, ako baza znanja ne sadrži dovoljno informacija za matematički ispravan zaključak vezan
uz upit, logički agent zahtijeva TELL operaciju, tj. nadopunu baze znanja informacijama koje nedostaju
za postizanje odgovora. Logički agent korištenjem logičkog zaključivanja dolazi do matematički
ispravnog zaključka.
Logičko rješavanje problema sastoji se od opisa problema formalnim matematičkim simbolima
te upotrebe matematike za rješavanje problema. Matematika potrebna za logičko rješavanje problema
sadržana je u formalnom logičkom sustavu, a ovdje ćemo prikazati korištenje propozicijske logike i
predikatne logike prvog reda (engl. FOPL First Order Predicate Logic).
Primjeri koji će se koristiti bit će temeljeni na kratkoj priči koju je napisao Sir Arthur Conan
Doyle iz 1891. godine s naslovom Slučaj identiteta(engl. A Case of Identity)
82
.
Slika 5-1. Sherlock Holmes dočekuje gospođicu Mary ilustracija iz Stand Magazin autorice Sidney
Paget gdje je 1891. godine priča prvi put objavljena
83
Sažetak priče
84
: Priča se odnosi na slučaj gospođice Mary Sutherland, žene koja ima značajan
prihod od kamata na fond koji joj je osnovao ujak. Međutim, Mary radi kao tipkačica i živi od zarede
tipkačice, a kamatu na fond daje majci i očuhu Jamesu Windibanku koji je samo 5 godina stariji od nje.
Zaručena je za mirnog stanovnika Londona gospodina Hosmera Angela, koji je nedavno nestao.
Zaručnik gospođice Sutherland osebujan je lik, prilično miran i prilično tajnovit u svom životu.
Gospođica Sutherland samo zna da radi u uredu u ulici Leadenhall, ali ništa konkretnije od toga. Sva su
joj pisma napisana pisaćim strojem, čak i potpis, a on inzistira na tome da mu ona pisma šalje preko
lokalne pošte.
82
https://etc.usf.edu/lit2go/32/the-adventures-of-sherlock-holmes/347/adventure-3-a-case-of-identity/
83
Slika je s https://en.wikipedia.org/wiki/A_Case_of_Identity#/media/File:Iden-01.jpg uz licencu 'Public Domain'.
84
Sažetak je adaptiran s https://en.wikipedia.org/wiki/A_Case_of_Identity
5 ZAKLJUČIVANJE I RASUĐIVANJE
141
Vrhunac tužne veze dolazi kada gospodin Angel na sami dan vjenčanja pred oltarom napušta
gospođicu Sutherland.
Gospođica Sutherland odlazi kod Sherlocka Holmesa čemu se protivi njen očuh.
Holmes, primjećujući cijeli niz činjenica vezanih uz gospođicu Sutherland i njen opis zaručnika,
a posebno činjenicu da se zaručnik susreće s gospođicom Sutherland samo dok je njezin mladenački očuh
James Windibank poslovno izvan zemlje, vrlo brzo donosi zaključak. Tipkano pismo potvrđuje njegovo
uvjerenje. Samo je jedna osoba mogla od ovoga imati korist, očuh gospodin James Windibank. Holmes
zaključuje da je zaručnik nestao jednostavnim izlaskom s druge strane kabine kočije.
Nakon što je riješio misterij, Holmes odlučuje da ne kaže svom klijentu gospođici Sutherland
rješenje s obrazloženjem da mu ona neće vjerovati s obzirom da živi u zabludi vezanoj sa zaručnikom.
Holmes joj je ranije savjetovao da zaboravi gospodina Angela, ali gospođica Sutherland to ne prihvaća i
zavjetuje se da će ostati vjerna zaručniku sve dok se ponovo ne pojavi, a najmanje deset godina.
Kako je Holmes došao do zaključka? Pogledajmo postupke logičkog rasuđivanja koji su mu pritom
pomogli.
5.1.1 Zaključivanje i rasuđivanje u propozicijskoj logici
Propozicijska logika je logika koja se temelji na sudovima (propozicijama). Obradili smo je u
poglavlju 4.3.1. Propozicije su činjenice koje mogu biti istine ili neistine.
Činjenice koje saznajemo na početku priče su:
Gospođica Mary Sutherland dolazi kod Sherlocka Holmesa.
Mary nosi naočale.
Mary ima različite čarape.
Mary Sutherland radi kao tipkačica.
Ima mali imetak koji joj je ostavio ujak.
Živi s majkom i očuhom.
Očuh je samo 5 godina stariji od nje.
Kamate imetka daje roditeljima, živi od zarade tipkačice.
Mary ima zaručnika Angela Hosmera.
Mary se sa zaručnikom sastaje samo kada je očuh na putu.
Zaručnik joj šalje pisma tipkana na pisaćem stroju, uključujući i potpis.
Zaručnik je nedavno nestao.
Očuh se protivi Marynom odlasku kod slavnog detektiva.
Ove činjenice potrebno je prikazati formalnim jezikom propozicijske logike.
Rečenice propozicijske logike mogu biti atomne ili složene. Atomne rečenice su sudovi (propozicije)
kojima pridružujemo vrijednost istinitosti. Složene rečenice gradimo korištenjem operatora. Primjeri
rečenica propozicijske logike vezani s našim primjerom su prikazani u tablici 5-1.
5 ZAKLJUČIVANJE I RASUĐIVANJE
142
Tablica 5-1. Rečenice propozicijske logike vezane s primjerom iz priče Slučaj identiteta
mary_lose_vidi
Atomna rečenica. Može imati
vrijednost istina ili nije
istina. U slučaju da radimo
opis prije opisanog
scenarija, ova rečenica imat
će vrijednost istina.
hosmer_je_otet
Atomna rečenica čiju
istinitost još ne poznajemo.
¬
hosmer_je_dosao_na_vjencanje
Rečenica koja se sastoji od
suda i operatora negacije.
hosmer_je_otet
"
hosmer_je_pobjegao
Rečenica sastavljena od dva
suda povezana operatorom
disjunkcije
A = mary_nosi_naocale
B = mary_lose_vidi
A
®
B
C = mary_ima_razlicite_carape
D = mary_je_stigla_u_zurbi
(B
#
C)
®
D
E = maryn_ocuh_ne_zeli_ukljuciti_detektiva
Rečenice složene od više sudova, a izražene jezikom propozicijske logike, imaju svoju vrijednost
istinitosti: istina (true, 1) ili laž (false, 0). Ako je izraz rečenica, ne znači da je nužno istinit. Istinitost
rečenice ovisi o istinitosti atomnih sudova koji grade rečenicu i o operatorima koji se pojavljuju u rečenici.
Rečenice propozicijske logike mogu biti:
Valjane tautologije (engl. Valid)
istinite za sve vrijednosti sudova
mary_lose_vidi
"
¬
mary_lose_vidi
Zadovoljive konzistentne (engl. Satisfiable)
za neke vrijednosti sudova istinite (ali ne za sve)
mary_nosi_naocale
®
mary_lose_vidi
Ne-zadovoljive kontradiktorne (engl. Unsatisfiable)
za sve vrijednost sudova je neistinite
mary_nosi_naocale
#
¬
mary_nosi_naocale
Zaključivanje se u propozicijskoj logici svodi na donošenje sudova o rečenicama (jesu li
tautologije, zadovoljive ili nezadovoljive), a može se izvoditi na dva osnovna načina:
ispunjavanjem tablica istine
zaključivanje pravilima.
5 ZAKLJUČIVANJE I RASUĐIVANJE
143
Zaključivanje tablicom istine
Operacije propozicijske logike definirane su tablicama istine (tablica 4-1). U njoj su eksplicitno
navedene vrijednosti složenih propozicija povezanih logičkim operatorima. Za svaki složeni izraz
propozicijske logike možemo napisati tablicu istine. Razmotrimo sljedeću složenu propoziciju:
((mary_lose_vidi
®
hosmer_se_lazno_predstavlja)
"
(hosmer_inzistira_na_sastancima_u_mraku
®
hosmer_se_lazno_predstavlja)
®
((mary_lose_vidi
#
{hosmer_inzistira_na_sastancima_u_mraku)
®
hosmer_se_lazno_predstavlja)
Značenje ove rečenice je sljedeće:
Operator implikacije govori nam da iz lijeve strane slijedi desna strana. Dakle, ako je lijeva,
tada je desna.
Lijeva strana implikacije je rečenica koja u sredini ima operator disjunkcije (veznik ili), pa
lijeva strana implikacije govori da je istinit ili prvi ili drugi dio.
Prvi dio lijeve strane je rečenica sastavljena od dviju propozicija povezanih operatorom
implikacije. Ova dva suda mogu imati bilo koje vrijednosti, a vrijednost implikacije ovisi o
njihovim vrijednostima. Dakle, tvrdimo da iz suda da Mary loše vidi možemo zaključiti da
joj se Hosmer mogao lažno predstavljati. Ova je rečenica istinita samo ako su vrijednosti
sudova u okruženju koji se opisuje, (našem scenariju), takve da je operacija implikacije dana
u tablici istine za takve vrijednosti istina.
Drugi dio lijeve strane također je implikacija dvaju sudova i ovisi o vrijednosti ovih sudova u
scenariju.
Desni dio centralne implikacije je opet implikacija, a govori nam da ako je istina lijeva strana,
tada slijedi sud da se Hosmer lažno predstavlja”.
Lijeva strana ove desne implikacije je rečenica od dva suda povezana operatorom konjunkcije
(veznik i), koja je istinita onda i samo onda ako su oba suda istinita.
Ova složena"rečenica je istinita, ako iz rečenice
((mary_lose_vidi
®
hosmer_se_lazno_predstavlja)
$"$
(hosmer_inzistira_na_sastancima_u_mraku
®
hosmer_se_lazno_predstavlja))
slijedi
((mary_lose_vidi
#
hosmer_inzistira_na_sastancima_u_mraku)
®
hosmer_se_lazno_predstavlja).
Označimo li propozicije
P = mary_lose_vidi
U = hosmer_se_lazno_predstavlja
V = hosmer_inzistira_na_sastancima_u_mraku
možemo napisati tablicu istine za sve moguće kombinacije vrijednosti ova tri suda (tablica 5-2). Iz tablice
istine vidimo da svaka interpretacija ovakve rečenice rezultira istinitom rečenicom, te je ova rečenica
valjana (tautologija), tj. uvijek istinita, za bilo koje kombinacije istinitosti sudova P, U i V.
5 ZAKLJUČIVANJE I RASUĐIVANJE
144
Tablica 5-2. Tablica istinitosti složene tvrdnje povezane s primjerom gdje 1 znači istina, a 0 laž. Crveno
je označena vrijednost istine cijele složene propozicije.
P
V
((P
®
U)
(V
®
U))
®
((P
V)
®
U)
1
1
1
1
1
1
1
1
1
0
1
1
1
0
1
1
1
1
0
0
1
1
0
0
1
0
0
1
1
0
1
0
0
1
1
1
1
0
1
1
0
0
1
1
1
0
1
1
0
1
1
0
1
0
1
0
0
0
1
1
1
0
1
0
Pravila zaključivanja (izvođenja)
Iako nam izvođenje tablice istine daje dobar uvid u značenje složenog logičkog izraza, u slučaju
još složenijih rečenica s više sudova i operacija ovakve tablice mogu postati poprilično velike i nepraktične
za korištenje. Zbog toga se u tim slučajevima koriste pravila zaključivanja koja složene izraze svode na
jednostavnije izraze.
Logička posljedica
G je logička posljedica formule F1, F2, ... , Fn ako svaka interpretacija koja zadovoljava F1, F2,
... , Fn također zadovoljava i G. To formalno pišemo na sljedeći način:
%&'%(')$'%*$ + $,
(5-1)
gdje je + double-turnstile simbol koji smo već spominjali u Uvodu ovog Poglavlja, a koji označava
semantičku posljedicu.
Na primjer, za situaciju iz naše priče oblika:
-&$#$-($#-.$#$-/$ + $0
(5-2)
mary_lose_vidi Λ hosmer_inzistira_na_sastancima_u_mraku
#
hosmer_pise_pisma_na_masini
#
hosmer_i_mary_sastaju_se_samo_kada_je_ocuh_na_putu
+ hosmer_i_ocuh_su_iste_osobe
Tablica 5-3 prikazuje zaključivanje korištenjem izravne metode kojom dokazujemo valjanost
(tautologiju) i metode opovrgavanja kojom dokazujemo nezadovoljivost (kontradiktornost).
Tablica 5-3. Zaključivanje izravnom metodom i metodom opovrgavanja
5 ZAKLJUČIVANJE I RASUĐIVANJE
145
Izravna metoda
Metoda opovrgavanja
(mary_lose_vidi
#
hosmer_inzistira_na_sastancima_u_
mraku
#
hosmer_pise_pisma_na_masini
#
hosmer_i_mary_sastaju_se_samo_kada
_je_ocuh_na_putu)
®
hosmer_i_ocuh_su_iste_osobe
Dokazati da je izraz valjan (tautologija).
(mary_lose_vidi
#
hosmer_inzistira_na_sastancima_u_
mraku
#
hosmer_pise_pisma_na_masini
#
hosmer_i_mary_sastaju_se_samo_kada_je
_ocuh_na_putu
#
hosmer_i_ocuh_su_iste_osobe)
Dokazati da je izraz proturječje
(kontradiktoran).
Pokazati da je
((F1
#
F2
#
F3, ...
#
Fn )
®
G ) je valjano.
Pokazati da je
(F1
#
F2
#
F3, ...
#
Fn
#
1
G) je proturječje.
Kod deduktivnog zaključivanja formula G je deduktivna posljedica formula F1, F2, , Fn, ako
i samo ako je G moguće izvesti (engl. Derive) iz premisa F1, F2, ... , Fn pravilima zaključivanja (engl.
Rules of Inference). Zaključujemo primjenom jednog od pravila zaključivanja, a izvedenu formulu
dodajemo skupu ulaznih pretpostavki (premisa). Postupak ponavljamo dok:
ne dobijemo da je izvedena formula identična cilju, i time smo dokazali pretpostavku, ili
više ne možemo izvesti nove logičke formule, što znači da ne možemo dokazati
pretpostavku.
Ovakvo se zaključivanje zove prirodno zaključivanje (engl. Natural Deduction). Postoji više
pravila zaključivanja koja u odnosu na operatore koji se u njima pojavljuju možemo podijeliti na pravila
konjunkcije, pravila disjunkcije, pravila implikacije i pravila negacije. Svako od njih može biti pravilo
uvođenja (engl. Introduction Rule) koje se prema engleskoj riječi označava velikim slovom I, na primjer
(#I) je pravilo uvođenja konjunkcije, ili pravilo eliminiranja (engl. Elimination Rule) koje se označava
velikim slovom E, pa je na primjer (#E) pravilo eliminiranja konjunkcije. Pravilima uvođenja
kombiniramo različite propozicije, a pravilima eliminiranja razbijamo složene propozicije u jednostavnije
forme. U nastavku ih sve navodimo.
PRAVILA KONJUNKCIJE
(#I) - UVOĐENJE KONJUNKCIJE
P,Q ! (P
#
Q) (5-3)
Ovo pravilo kaže da u slučaju kada su dvije propozicije P i Q svaka za sebe (odvojeno) istinite da
će i složena propozicija (P
#
Q) koju jezično izražavamo (P i Q) biti istinita. U zapisu pravila korišten je
simbol ! (turnstile) koji smo već spomenuli u uvodu kao sintaktičku posljedicu, a jezično se u okviru
pravila zaključivanja interpretira riječju slijedi (engl. Infer) pa se zbog toga i pravila zaključivanja
ponekad nazivaju i pravila slijeđenja (inferencije). Drugi način zapisivanja pravila zaključivanja je
korištenje simboličkog razlomka koji u brojniku ima pretpostavke, a u nazivniku zaključak. Pravilo
uvođenja konjunkcije zapisano na ovaj način izgleda:
2#34
-'0
2-#0 4
Mi ćemo u nastavku koristiti oznaku turnstile. Primjer uvođenja konjunkcije je:
mary_ima_imetak, mary_daje_kamate_od_imetka_majci_i_ocuhu
! (mary_ima_imetak
$$#
mary_daje_kamate_od_imetka_majci_i_ocuhu)
(#E) ELIMINACIJA KONJUNKCIJE
5 ZAKLJUČIVANJE I RASUĐIVANJE
146
(P
#
Q) ! P (5-4)
(P
#
Q) ! Q (5-5)
Ovo pravilo kaže suprotno: u slučaju kada je (P i Q) istinito, onda su i propozicije P i Q svaka za
sebe (odvojeno) istinite.
(mary_ima_imetak
$$#
mary_daje_kamate_od_imetka_majci_i_ocuhu)
! mary_ima_imetak, mary_daje_kamate_od_imetka_majci_i_ocuhu
PRAVILA DISJUNKCIJE
(ÚI) - UVOĐENJE DISJUNKCIJE
P ! (P
Ú
Q) (5-6)
P ! (Q
Ú
P) (5-7)
Ovo pravilo kaže da u slučaju kada je propozicija P istinita, istinite će biti i propozicije (P ili Q) i
(Q ili P).
mary_ima_imetak ! (mary_ima_imetak
"
mary_ima_posao)
mary_ima_imetak ! (mary_ima_posao
$$"$$
mary_ima_imetak)
(ÚE) ELIMINACIJA DISJUNKCIJE
(P
Ú
Q), (P
®
R), (Q
®
R) ! R (5-8)
Ovo nije jedino pravilo eliminacije disjunkcije ali se obično uzima za standardno. Pravilo kaže da
ako vrijedi ako je P onda je R i ako je Q onda je R, a uz to znamo da je istinito P ili Q, onda slijedi da je
istinita i propozicija R. Drugi primjeri eliminacije disjunkcije su:
(P
Ú
Q),
¬
P ! Q (5-9)
(PÚQ), ¬Q ! P (5-10)
i često se naziva disjunktivno ulančavanje (disjunktivni silogizam).
vjencanje_se_odrzalo
"
mary_nema_muža ,
¬
vjencanje_se_odrzalo
! mary_nema_muza
PRAVILA IMPLIKACIJE
(®I) - UVOĐENJE IMPLIKACIJE
¬
P ! (P
®
Q) (5-11)
Q ! (P
®
Q) (5-12)
Implikacija Ako je P onda je Q.je istinita ako je P lažna, ali isto tako i ako je Q istinita.
(®E) ELIMINACIJA IMPLIKACIJE
P, (P
®
Q) ! Q (5-13)
Ovo je vrlo važno pravilo zaključivanja, možda jedno od najčešće korištenih. Ima i svoje posebno
ime i naziva se modus ponens. Ilustrirajmo ga primjerom.
Neka je prva propozicija P = mary_nosi_naocale, a druga propozicija Q = mary_lose_vidi.
Koristeći modus ponens zaključujemo:
mary_nosi_naocale, mary_nosi_naocale
®
mary_lose_vidi ! mary_lose_vidi
čije"bi"jezični"opis"bio:" Ako Mary nosi naočale, a naočale nosi kada loše vidi, onda znači da Mary loše vidi..
5 ZAKLJUČIVANJE I RASUĐIVANJE
147
Uz modus ponens važan je i modus tollens. I ovdje se radi o eliminaciji implikacije, ali na
drugačiji način:
¬
Q, (P
®
Q) !
¬
P (5-14)
Pogledajmo isti primjer za iste propozicije kao kod modus ponensa:
vjencanje_se_odrzalo,hosmer_je_iskren
®
vjencanje_se_odrzalo
! hosmer_je_iskren
čije bi jezični opis bio: Ako nije istina da se vjenčanje održalo, a da je Hosmer iskren vjenčanje bi se
održalo, onda znači da nije istina da je Hosmer iskren.
PRAVILA NEGACIJE
(¬I) - UVOĐENJE NEGACIJE
(P
®
Q), (P
®¬
Q) !
¬
P (5-15)
Ovo pravilo zaključivanja naziva se reductio ad absurdum što možemo prevesti redukcija do
apsurda ili redukcija do nemogućeg. Naziva se i dokaz nemogućega, a sam Aristotel ju je često koristio.
Ideja polazi od toga da želimo oboriti propoziciju P. Ako dokažemo da pretpostavka o istinitosti tvrdnje P
vodi u kontradikciju (obje implikacije (P
®
Q) i (P
®¬
Q) su u tom slučaju istinite), tada je zbog zakona
kontradikcije propozicija P sigurno lažna.
(¬E) ELIMINACIJA NEGACIJE
Ponekad se kao eliminacija negacije uvodi već spomenuta ekvivalencija dvostruke negacije.
¬¬
P ! P (5-16)
Nije istina da Mary nema imetak.vodi u zaključak Mary ima imetak.”.
Ovo je ujedno bila jedna od ekvivalencija iz poglavlja 4.3.1. U postupcima zaključivanja koriste se
i druge ekvivalencije, na primjer na temelju kontrapozicije zaključujemo:
(P
®
Q) ! (
¬
Q
®¬
P) (5-17)
a primjer može biti da na temelju implikacije: Ako je Hosmer iskren, onda bi se vjenčanje
održalo. zaključujemo: Ako se vjenčanje nije održalo, onda Hosmer nije iskren.
I na kraju spomenimo još jedan put ulančavanje ili silogizam. Spomenuli smo ga kod
eliminacije disjunkcije kao disjunktivno ulančavanje. Postoji i hipotetsko ulančavanje koje se na neki
način smatra standardno, pa se izostavlja naziv hipotetsko i naziva se samo ulančavanje (silogizam).
Odnosi se na ulančavanje implikacija:
(P
®
Q), (Q
®
R) ! (P
®
R) (5-18)
U detektivskom primjeru imali smo situaciju:
Ako Mary nosi naočale, logično je da ona loše vidi, a ako loše vidi, logično je da Mary ne raspoznaje ljude.
Zaključak bi bio ako Mary nosi naočale logično je da Mary ne raspoznaje ljude.
(mary_nosi_naocale
®
mary_lose_vidi),
(mary_lose_vidi
®
mary_ne_raspoznaje_ljude)
! (mary_nosi_naocale
®
mary_ne_raspoznaje_ljude)
Osnovni nedostatak prirodnog zaključivanja je što je implementacija postupka dosta složena.
Upravljački program mora imati dosta složenu upravljačku strukturu koja određuje kada koja pravila
zaključivanja upotrijebiti, posebno zbog velikog broja pravila zaključivanja. Postupak se može
pojednostavniti uvođenjem novog pravila zaključivanja koje zovemo rezolucijsko pravilo (engl.
Resolution Rule) kojim se određenim situacijama može smanjiti broj premisa.
5 ZAKLJUČIVANJE I RASUĐIVANJE
148
Rezolucijsko pravilo
Krenimo najprije s novom malom detektivskom pričom. Imamo sljedeću situaciju:
Dogodilo se ubojstvo. Sobarica tvrdi da je u vrijeme ubojstva bila u biblioteci i čistila prašinu,
dok susjed tvrdi da ju je čuo u vrtu kako se svađa sa žrtvom kroz otvoren prozor. Dakle, iz sobaričinog
iskaza slijedi da je sobarica bila ili u biblioteci ili laže zato što je bila u vrtu. Dok iz susjedovog iskaza
možemo zapisati da ili susjed laže zato što sobarica nije bila u vrtu ili je bila u vrtu zato što ju je susjed
čuo kako se svađa.
Iz ovoga možemo zaključiti da je ili sobarica bila u biblioteci ili je susjed čuo svađu”.
(sobarica_u_biblioteci
Ú
sobarica_u_vrtu), ( sobarica_u_ vrtu
Ú
susjed_cuo_svađu)
! sobarica_u_biblioteci
Ú
susjed_cuo_svadju
U simboličkoj formi ovo zapisujemo:
(A
Ú
B), (B
Ú
C) ! (A
Ú
C)
gdje su:
A = sobarica_u_biblioteci
B = sobarica_u_vrtu
C = susjed_cuo_svadju
Rezolucija svođenjem na konjunktivnu normalnu formu (CNF)
Konjunktivna normalna forma (engl. CNF - Conjunctive Normal Form) je logički izraz koji se
sastoji isključivo od konjunkcija (#) i disjunkcija (Ú). CNF izrazi posebno su pogodni za automatsko
zaključivanje i automatsko dokazivanje teorema. Svođenje logičkih izraza na konjunktivnu normalnu
formu provodi se primjenom pravila prikazanih u tablici 5-4.
Tablica 5-4. Pravila za svođenje logičkih izraza na konjunktivnu normalnu formu s primjerima
Zamjena
implikacije
A
®
B
1
A
"$
B
sobarica_u_vrtu
®
susjed_cuo_svadju
sobarica_u_vrtu
"
susjed_cuo_svadju
Zamjena
ekvivalencije
A
«
B
(
1
A
"$
B)
#
(
1
B
"$
A)
sobarica_u_vrtu
«
susjed_cuo_svadju
sobarica_u_vrtu
"
susjed_cuo_svadju
#$$
susjed_cuo_svadju
"
sobarica_u_vrtu
$
Premještanje
negacija
1
(
1
A)
1
(A
#
B)
1
(A
"$
B)
A
1
A
"
1
B
1
A
#
1
B
5 ZAKLJUČIVANJE I RASUĐIVANJE
149
( sobarica_u_biblioteci
Ú
sobarica_u_vrtu)
sobarica_u_biblioteci
#$
$$$$$$$$$$$$$$$
sobarica_u_vrtu
Transformacija
u konjunkciju
A
"
(B
#
C)
(A
#
B)
"
C
(A
"
B)
#
( A
"
C)
(A
"
C)
#
(B
"
C)
sobarica_u_biblioteci
"
(sobarica_u_vrtu
#$
$$$$$$$$$$$$$$$$$$$$$$$$
susjed_cuo_svadju)
(sobarica_u_vrtu
#$
$$$$$$$$
susjed_cuo_svadju)
"$
$$$$$$$$$$$$$$$
sobarica_u_biblioteci
(sobarica_u_biblioteci
"
sobarica_u_vrtu)
#
(sobarica_u_biblioteci
"
susjed_cuo_svadju)
(sobarica_u_vrtu
"
sobarica_u_biblioteci)
#
(susjed_cuo_svadju
"$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$
$$$$$$$$$$$$$$$$
sobarica_u_biblioteci)
$
Vratimo se sada našoj priči o Mary i pokažimo kako se provodi zaključivanje svođenjem na
konjunktivnu normalnu formu.
Polazimo od dostupne baze znanja:
1. mary_nosi_naocale
2. mary_ima_razlicite_carape
3. ocuh_je_mlad
4. mary_nosi_naocale
Ú
mary_ima_razlicite_carape
Ú
mary_je_stigla_u_zurbi
5. mary_je_stigla_u_zurbi
Ú
ocuh_ne_zeli_detektiva
6. ocuh_ne_zeli_detektiva
Ú
ocuh_nesto_skriva
7. ocuh_je_mlad
Ú
ocuh_nesto_skriva
Ú
ocuh_je_hosmer
Temeljem rečenica iz baze, primjenom pravila dobijemo:
8. [1 i 4] mary_ima_razlicite_carape
Ú
mary_je_stigla_u_zurbi
9. [2 i 8] mary_je_stigla_u_zurbi
10. [9 i 5] ocuh_ne_zeli_detektiva
11. [10 i 6] ocuh_nesto_skriva
Kao konačni zaključak možemo izvesti:
12. [11 i 3] ocuh_je_hosmer
Propozicijska logika je deklarativna logika. Dozvoljava djelomične informacije o scenariju.
Također dozvoljava kompoziciju elementarnih sudova u složene sudove, a značenja rečenica propozicijske
logike nezavisna su o kontekstu i o semantici elementarnih sudova. Međutim, u usporedbi s prirodnim
jezicima propozicijska logika ima ograničenu mogućnost izražavanja. Osnovni nedostatak je što ne
dozvoljava izražavanje o odnosima među objektima. Rješenje ovog nedostatka je, kako smo već naglasili,
u upotrebi predikatne logike.
5.1.2 Zaključivanje i rasuđivanje u predikatnoj logici
U poglavlju 4.3.2 napravljen je uvod u predikatnu logiku koja se temelji na predikatima,
funkcijama koje, ovisno o argumentima, vraćaju vrijednost istinitosti. Osnovne značajke predikatne
logike su:
5 ZAKLJUČIVANJE I RASUĐIVANJE
150
atomi opisani pomoću predikata, npr. nosi_naocale(mary)
odnosi među atomima opisani pomoću predikata, npr. zaruceni(mary,hosmer)).
Predikat nam vraća vrijednost istinitosti. Na primjer, ako je zaruceni(mary,hosmer) istinito,
onda su stvarno Mary i Hosmer zaručeni. Predikatne tvrdnje ovise o vrijednosti varijable istinitosti koju
smo uveli. Npr. ima_sumnje(X) znači netko nešto sumnja. A tko je to, to tek treba pronaći.
Sva pravila propozicijske logike vrijede i za predikatnu logiku, samo što nam u predikatnoj logici
sudovi imaju bolje izražena značenja.
Predikatna logika uvodi još i kvantifikatore
5
za svaki i
6
postoji, kojima se generaliziraju
logički izrazi, a u predikatnoj logici prvog reda kvantifikatori se odnose samo na varijable. Primjer
upotrebe kvantifikatora je:
5
X posjecuje(X,scherlock)
®
ima_sumnju(X)
što možemo interpretirati: Svatko tko posjećuje Sherlocka Holmesa ima nekakve sumnje.
Primjeri rečenica predikatne logike vezani s našom pričom su:
Mary loše vidi. - lose_vidi(mary)
Mary je zaručena za Hosmera Angela. - zarucena(mary,hosmer)
Mary ima očuha. -
$
X ocuh_od(mary,X)
Neki muškarac se lažno predstavlja kao Hosmer Angel i ne želi da se Mary uda. -
5
X muskarac(X), predstavlja_se_kao(X,hosmer), ne_zeli_da_se_uda(mary,X)
Roditelji osobe koja nije udana dobivaju kamate od nasljedstva.
5
X,
5
Y Roditelj_od(X,Y), Nije_udana_(X), ima_nasljedstvo(X)
®
dobija_novce(Y)
Zaključivanje u predikatnoj logici prvog reda
Zaključivanje tablicama istine koje je bilo korisno u propozicijskoj logici ne može se primijeniti u
predikatnoj logici. Nadalje, izravna metoda i metoda opovrgavanja nepraktične su zbog velikog broja
vrijednosti koje varijable mogu poprimiti, pa se zbog toga u predikatnoj logici prvog reda koriste druga
pravila zaključivanja.
Pravilo univerzalne specijalizacije
Kod pravila univerzalne specijalizacije (engl. Universal Instantation Rule) svaki element
domene može biti zamijenjen s univerzalno specificiranom varijablom:
"
X posjeduje_odgovarajucu_pisacu_masinu(X)
®
pise_lazna_pisma(X)
posjeduje_odgovarajucu_pisacu_masinu (ocuh)
i onda radimo zamjenu varijable X:
X=ocuh
posjeduje_odgovarajucu_pisacu_masinu(ocuh)
®
pise_lazna_pisma(ocuh)
Ako je vrijednost ove implikacije istinita, i ako je vrijednost lijevog operanda istinita, istinita mora
biti i vrijednost desnog operanda, pa donosimo zaključak:
pise_lazna_pisma(ocuh)
Kako bismo dokazali da je objekt koji piše lažna pisma upravo očuh, oslanjamo se na implikaciju
iz baze znanja koja univerzalno vrijedi, radimo zamjenu varijable objektom. Nakon toga moramo pokazati
da je lijeva strana implikacija istinita, a to radimo dodatnim pretraživanjem baze znanja ili nadopunom
baze znanja odgovorom na pitanje.
5 ZAKLJUČIVANJE I RASUĐIVANJE
151
Skolemizacija
U procesu zaključivanja predikatnom logikom često se koristi postupak koji se zove
skolemizacija (engl. Skolemization). Ime je dobila po norveškom matematičaru Thoralfu Skolemu
(1887. 1963.) koji ju je uveo s ciljem sustavne eliminacije egzistencijalnih kvantifikatora. Varijabla
vezana s egzistencijalnim kvantifikatorom zamjenjuje se takozvanim Skolem konstantama ili Skolem
funkcijama. Pogledajmo primjer:
$
X posjeduje_odgovarajucu_pisacu_masinu (X)
skolemizacija
->
posjeduje_odgovarajucu_pisacu_masinu (ocuh)
$
X
$
Y nasljednik(X,Y)
skolemizacija
-> nasljednik (rodjak_od(Y),Y)
skolemizacija
->
$
nasljednik(rodjak_od(lord),lord)
U prvom izrazu X je zamijenjen Skolem konstantom ocuh, a u drugom izrazu X je najprije
zamijenjen Skolem funkcijom rođak_od(Y) pa je nakon toga Y zamijenjen Skolem konstantom lord.
Zašto ovo možemo napraviti? Kako opravdavamo zamjenu varijable konstantom? Lijeva i desna
strana izraza sigurno generalno nisu ekvivalencije, ali ako su lijeva i desna strana podjednako
zadovoljene u odnosu na istinitost, onda to možemo napraviti, što znači na primjer za prvi izraz:
Ako
$
X posjeduje_odgovarajucu_pisacu_masinu(X)
º
T (istina)
onda posjeduje_odgovarajucu_pisacu_masinu (ocuh)
º
T (istina)
Skolemizacija je važan dio postupka zaključivanja predikatne logike, a za više detalja čitatelja
upućujemo na literaturu.
Zaključivanje unaprijed i unatrag
Zaključivanje u predikatnoj logici prvog reda zapravo je realizacija ASK zadatka logičkog agenta.
Baza znanja sastoji se od rečenica izraženih u jeziku predikatne logike prvog reda koje su istinite. Kada
imamo izgrađenu bazu znanja, možemo postaviti pitanje i kroz zaključivanje provjeriti je li taj upit istinit.
Dvije su osnovne metode pretraživanja baze znanja: ulančavanje unaprijed i ulančavanje
unatrag. Ulančavanjem unaprijed (engl. Forward Chaining) kreće se od poznatih činjenica,
primjenjuju se rečenice koje služe kao grupna pravila te se izvode nove činjenice i provjerava se je li se
među novim izvedenim činjenicama nalazi i činjenica koja odgovara upitu. Npr. baza znanja sastoji se od
rečenica:
nosi_naocale(mary)
"
X, nosi_naocale(X)
®
lose_vidi(X)
Postavljamo upit:
lose_vidi(mary)
Ulančavanje unaprijed krenut će od poznatih činjenica nosi_naocale(mary) te ih primijeniti na
pravila. Zamjenom varijabli s konstantom:
nosi_naocale(mary)
®
lose_vidi(mary)
Ako je implikacija istina, tada istinitost lijeve strane implicira istinitost desne strane, pa
zaključujemo da je lose_vidi(mary)"istinita činjenica. Zaključivanje unaprijed koriste jezici CLIPS i
JESS.
Ulančavanje unatrag (engl. Backward Chaining) kreće od upita i pretpostavke da je upit točan
te pretražujući bazu znanja traži rečenice"koje"podržavaju"istinitost"takve rečenice. Za prethodni primjer
postavljamo upit:
lose_vidi(mary)
Ulančavanje unatrag kreće od pretpostavke da je lose_vidi(mary) istinito pa traži dokaze za
to. Pravilo
"
X, nosi_naocale(X)
®
lose_vidi(X)"koristi varijablu, i možemo ga upotrijebiti ako
varijablu zamijenimo odgovarajućom konstantom kako bi desna strana odgovarala upitu. Rezultat je:
5 ZAKLJUČIVANJE I RASUĐIVANJE
152
nosi_naocale(mary)
®
lose_vidi(mary)
Ovime je izraženo da se dokaz da je lose_vidi(mary) sastoji od dokazivanja da
nosi_naocale(mary), te smo sada u potrazi za istinitošću ove rečenice. Kako baza znanja ovu rečenicu
sadrži, dokaz je gotov i pronašli smo potvrdu upita. Jezik Prolog kod zaključivanja koristi ulančavanje
unatrag.
Obje metode korisne su za zaključivanje korištenjem baze znanja koja se sastoji od činjenica i
pravila, no obje metode imaju svoje nedostatke. Ulančavanje unaprijed koristi veći broj činjenica nego što
nam je potrebno, dok ulančavanje unatrag povratno pretražuje bazu znanja više puta.
5.1.3 Rasuđivanje zdravim razumom
Predikatna logika prvog reda pogodna je za opise stanja realnog svijeta, no ipak nije potpuna.
Pojedinačne rečenice predikatne logike mogu biti istinite ili lažne, no predikatna logika ne sadrži
mehanizam za promjenu istinitosti rečenica kroz vrijeme. Drugim riječima, nedostaje joj način
izražavanja dinamike i vremena kako bi se moglo izraziti opise scenarija događaja u rečenicama još
bližima prirodnom jeziku.
Cilj logičkog rasuđivanja je da bude što sličniji ljudskom rasuđivanju zdravim razumom (engl.
Common Sense). Rasuđivanje zdravim razumom donosi sudove o fizičkim svojstvima, svrsi, namjerama
ili ponašanju ljudi i objekata, kao i mogućih posljedica njihovog djelovanja i interakcija na temelju
osjetilnih informacija i znanja. Zdravorazumsko znanje je znanje koje ljudi, često i nesvjesno, skupljaju
cijeli život, a dijeli ga većina ljudi i svakodnevno koristi bez da ga je posebno svjesna. Rasuđivanje zdravim
razumom temelji se na psihologiji zdravog razuma, ljudskoj sposobnosti da objasni, a donekle i
predvidi, ponašanje i mentalna stanja drugih ljudi, te na ljudskoj sposobnosti da može razumjeti i
objasniti pojave i događanja u svijetu oko sebe.
Postoje brojni primjeri uspješne primjene zaključivanja zdravim razumom u umjetnoj
inteligenciji, kao što je kvalitativno rasuđivanje, rasuđivanje o taksonomijama, temporalno rasuđivanje.
Primjer jedne vrste temporalnog rasuđivanja je mehanizam rasuđivanja koji je 1963. godine osmislio
John McCarthy i nazvao ga situacijski račun (engl. Situation Calculus). Situacijski račun, koji se
temelji na teoriji zdravog razuma, je s gledišta mogućnosti izražavanja rečenica prirodnog jezika potpuniji
od predikatne logike prvog reda jer dozvoljava i dinamiku. U logičko zaključivanje uvedeno je i vrijeme.
Činjenice u situacijskom računu su istinite ako je istina da se dogodio događaj koji ih pokreće i nije se
dogodio događaj koji ih zaustavlja. Npr.
drzi(sherlock,povecalo) IF
uzeo(sherlock,povecalo) & ostavio(sherlock,povecalo)
Za više detalja o situacijskom računu i rasuđivanju zdravim razumom čitatelja upućujemo na
dodatnu literaturu kao što je (Kovalski, 1979.) ili (Reiter, 2001.).
5.2 Vjerojatnosno zaključivanje i rasuđivanje
Iako je standardna logika pogodna za zaključivanje i rasuđivanje u umjetnoj inteligenciji, često
nije dovoljna za zaključivanje o događajima. Nudi samo dvije vrijednosti istinitosti. To je možda i dovoljno
za situacije kada imamo sigurne podatke, ali u stvarnosti rijetko ćemo imati podatke na koje se možemo
u potpunosti osloniti.
Mi ljudi zapravo puno češće razmišljamo u duhu vjerojatnosti:
Je li nebo plavo? Vjerojatno je, ali postoji vjerojatnost da nas oči varaju i da je nebo zapravo neke
druge boje iako ga svi ljudi doživljavaju kao plavog.
Razlozi za nesigurnost su:
lijenost teško je prikupiti sve podatke i sve uzročno-posljedične veze potrebne za
zaključivanje
5 ZAKLJUČIVANJE I RASUĐIVANJE
153
nedovoljno teorijsko znanje npr. medicina još ne raspolaže dovoljnim teoretskim
znanjem za dijagnostiku
nedovoljno praktično znanje ne možemo napraviti sve potrebne testove (npr. u medicini
ne možemo napraviti sve moguće pretrage).
Dobra strana vjerojatnosti jest da ona u jednoj veličini, numeričkoj vrijednosti, zbraja
nesigurnosti koje proizlaze iz različitih razloga. Racionalni agent uvijek će odabrati akciju koja ima
najveću vjerojatnost da ga dovede do cilja.
Vjerojatnosno zaključivanje temelji se na a priori, uvjetnim i a posteriori vjerojatnostima koje smo
već spominjali u poglavlju o vjerojatnosnoj logici. Pogledajmo detaljnije što one znače.
5.2.1 A priori vjerojatnosti
A priori ili priorne vjerojatnosti su vjerojatnosti događaja, vjerojatnosti da se događaj dogodio.
Obično se računaju kao omjer broja razmatranih događaja i ukupnog broja mogućih događaja. Na primjer,
kod bacanja novčića možemo promatrati događaje:
pismo novčić je pao na tlo sa stranom na kojoj se nalazi znamenka prema gore
glava novčić je pao na tlo sa stranom na kojoj se nalazi slika prema gore.
Označimo s P(glava) vjerojatnost događaja glava. Imamo dva moguća ishoda događaja (pismo i
glava) od kojeg je jedan promatrani događaja (glava).
A priori vjerojatnost računamo kao :
P(glava)=(broj željenih događaja)/(ukupan broj događaja) = 1/2 = 0,5
Ako je P(glava) = 0,5, možemo postaviti pitanje kolika je P(pismo)?
Zbroj a priori vjerojatnosti svih događaja u domeni mora biti 1 pa vrijedi:
P(pismo) = 1 - P(glava) = 1 0,5 = 0,5
Ako je P(sunce) = 0,7, kolika je vjerojatnost da se dogodi neki drugi događaj osim sunce P(
1
sunce)?
P(
1
sunce) = 1 0,7 = 0,3
Promotrimo sada pojave koji imaju više od dva ishoda. Skup svih ishoda ili događaja nazivamo
domena.
Domena= {sunce, kiša, snijeg, oblačno}
Recimo da je:
P(sunce) = 0,7
P(kiša)=0,2
P(snijeg)=0,02
Postavimo pitanje kolika je a priori vjerojatnost "P(oblačno)?
P(oblačno) =1P(sunce)P(kiša)P(snijeg) =1 0,7 0,2 0,02 = 0,08
5.2.2 Združena vjerojatnost
Kada imamo događaje u nizu, možemo se zapitati koja je vjerojatnost da dva dana zaredom budu
sunčana. Ovakve događaje nazivamo združenim događajima. Označavamo ih s P(S1
#
S2) ili najčešće
još jednostavnije P(S1,S2), a ovaj posljednji oblik zapisa i mi ćemo ovdje koristiti. Vjerojatnost da će se
dva događaja dogoditi zajedno nazivamo združena vjerojatnost. Ako su događaji nezavisni, što znači da
pojava jednog nije vezana uz pojavu drugog, združenu vjerojatnost računamo kao umnožak a priori
vjerojatnosti pojedinačnih događaja (više o nezavisnim događajima u poglavlju 5.2.5):
P(S1,S2) = P(S1)
*
P(S2) (5-19)
5 ZAKLJUČIVANJE I RASUĐIVANJE
154
Na primjer, bacanja novčića su nezavisni događaji, pa možemo izračunati kolika je vjerojatnost
da bacanjem dvaju novčića istovremeno na oba bude pismo:
P(novčić1=pismo i novčić2=pismo) = P(pismo)
*
P(pismo) = 0,5
*
0,5 = 0,25
Zadatak 4. Združene#vjerojatnosti"
Grad ima 5 trgovina i 2 skupine pljačkaša koji pljačkaju jednom tjedno. Pljačkaši su jednako
uspješni i trgovine biraju slučajnim izborom.
Slika 5-2. Dvije skupine pljačkaša i pet trgovina koje se mogu opljačkati
Kolika je vjerojatnost da će trgovina 3 (T3) biti opljačkana barem jednom ovaj tjedan?
P(T3) = 1/5 + 1/5 = 0,4
Kolika je vjerojatnost da će T3 biti opljačkana 2 puta ovaj tjedan?
P(T3,T3) = 1/5
*
1/5 = 0,04
Kolika je vjerojatnost da će skupina 2 opljačkati T2 u petak?
P(P2,T2,D5) = 1/2
*
1/5
*
1/7 = 1/70"= 0,0143
5.2.3 Uvjetna vjerojatnost
Osim združenih vjerojatnosti, možemo promatrati i uvjetne vjerojatnosti koje se označavaju P(S2
| S1) i računaju jednadžbom:
P(S2 | S1)= P(S1,
$
S2) / P(S1) (5-20)
gdje je P(S1, S2) združena vjerojatnost, a P(S1) a priori vjerojatnost događaja S1.
Sada se ponovo možemo vratiti združenoj vjerojatnosti i izračunati je preko uvjetne vjerojatnosti
ako su događaji S1 i S2 zavisni:
P(S1,
$
S2) = P(S2 | S1)
*
P(S1) (5-21)
Ako imamo više od dva događaja S1, S2, , Sn, primjenjuje se pravilo ulančavanja (engl.
Chain Rule):
27*')'7&4$8
9
-27:;
<
7=
/0 !
12!
4
(
/2 !
$
(5-22)
Na primjer za 4 događaja:
5 ZAKLJUČIVANJE I RASUĐIVANJE
155
P(S4,
$
S3, S2, S1) = P(S4 | S3, S2, S1)
*
P(S3, S2, S1) =
= P(S4 | S3, S2, S1)
*
P(S3 | S2, S1)
*
P(S2, S1) =
= P(S4 | S3, S2, S1)
*
P(S3 | S2, S1)
*
P(S2 | S1)
*
P(S1)
5.2.4 Nezavisnost
Dvije varijable odnosno dva događaja su nezavisna ako pojava jednog ni na koji način ne utječe
na pojavu drugog. Ako su S1 i S2 nezavisni, tada je njihova združena vjerojatnost (vjerojatnost
istovremene pojave obaju događaja) jednaka umnošku njihovih a priori vjerojatnosti što smo već napisali
u jednadžbi (5-19). Također, poznato je da je za nezavisne događaje uvjetna vjerojatnost jednaka a priori
vjerojatnosti događaja S2:
P(S2|S1) = P(S1, S2) / P(S1) = P(S1)
*
P(S2) / P(S1)= P(S2) (5-23)
Na primjer, zanima nas vjerojatnost da nakon prvog bacanja novčića i drugo bacanje bude pismo.
P(bacanje1=pismo | bacanje2=pismo) = ?
Kako su bacanja novčića nezavisni događaji pišemo:
P(S2 | S1)= P(S2) = 0,5
Uvest ćemo još i pojam uvjetna nezavisnost
(engl. Conditional Independence). Kod definiranja
uvjetne nezavisnosti ne moramo ništa znati o nezavisnosti dvaju događaja, već ih promatramo samo u
prisutnosti trećeg, uvjetnog događaja. Kažemo da su X i Y uvjetno nezavisni u prisutnosti Z. To
podrazumijeva zadovoljenje sljedećih uvjeta:
P(X,Y|Z) = P(X|Z)
*
P(Y|Z) (5-24)
P(X|Y,Z) = P(X|Z) (5-25)
P(Y|X,Z) = P(Y|Z) (5-26)
Ako su X i Y uvjetno nezavisni u prisutnosti Z, to znači da pojava X ne ovisi o pojavi Y i obrnuto
(Y ne ovisi o pojavi X) ako je prisutan Z. Pri tome ne mora biti slučaj da su X i Y nezavisni i bez prisutnosti
Z. Ovo mora vrijediti za sve vrijednosti varijable Z. Drugim riječima, uvjetne vjerojatnosti dviju varijabli
X i Y u prisutnosti Z ponašaju se kao nezavisne vjerojatnosti, no bez pojave Z te dvije varijable ne moraju
biti nezavisne.
Uvjetna nezavisnost važan je pojam koji se koristi kod grafičkih vjerojatnosnih modela (engl.
Probabilistic Graphical Models) koji su temelj za d-separaciju. Najpoznatiji primjer grafičkog
vjerojatnosnog modela su Bayesove mreže koje obrađujemo u poglavlju 5.2.6 gdje i detaljnije opisujemo
d-separaciju.
5.2.5 Vjerojatnosno zaključivanje
Najjednostavnija metoda za vjerojatnosno zaključivanje temelji se na kreiranju potpune
tablice distribucije združenih vjerojatnosti. Pogledajmo primjer pljačkaša i trgovina. Već smo izračunali
da je vjerojatnost da"će"T3 biti opljačkana 2 puta ovaj tjedan biti:
P(T3,T3 ) = 1/5
*
1/5 = 0,04
a vjerojatnost da"će"skupina 2 opljačkati T2 u petak:
P(P2,T2,D5) = 1/2
*
1/5
*
1/7 = 1/70 = 0,0143
zato što su a priori vjerojatnosti pljačkanja bilo koje od 5 trgovina P(T) = 1/5, pljačkanja od bilo koje od
2 skupine pljačkaša P(P) = ½, i pljačkanja za bilo koji dan u tjednu P(D) = 1/7. Ovakav problem možemo
rješavati na način da kreiramo tablicu združenih vjerojatnosti koju prilagođavamo po potrebi. Krećemo
od definiranja domene problema.
Domena problema:
1. pljačkaši P1 i P2
"
5 ZAKLJUČIVANJE I RASUĐIVANJE
156
2. trgovine T1, T2, T3, T4, T5 i
"
3. dani D1, D2 ,D3, D4, D5, D6, D7. "
Ako su sve trgovine jednake, oba tima jednako uspješna u pljačkanju i svi dani u tjednu jednako
pogodni za pljačku, tablica se kreira na način da stupci predstavljaju jednu varijablu (dani u tjednu), a
redci drugu (trgovine).
Tablica 5-5. Tablica u kojoj definiramo domenu problema
Tablicu punimo s vrijednostima združenih vjerojatnosti, vodeći pritom računa da je ukupna suma
svih vrijednosti u tablici 1. Tako na primjer prva vrijednost tablice na presjeku T1 i D1 predstavlja
združenu vjerojatnost da se pljačka T1 dogodi u ponedjeljak. Pritom je vjerojatnost da je T1 opljačkana
jednaka 1/5, a vjerojatnost da je pljačka u ponedjeljak 1/7. Množenjem tih dviju vrijednosti dobije se
vrijednost združene vjerojatnosti:
P(T1 # D1)= P(T1)
*
P(D1) = 1/5
*
1/7=1/35
Na isti se način izračunavaju vrijednosti za sva ostala polja tablice.
Tablica 5-6. Tablica s vrijednostima združenih vjerojatnosti
Nakon što uzmemo u obzir i treća varijablu (skupine pljačkaša S1 i S2), tablica će dobiti treću
dimenziju. Za potrebe vizualizacije tablice mi ćemo tu dimenziju prikazati tako da polje podijelimo na dva
dijela. Vrijednosti združenih vjerojatnosti su:
P(T1 # D1 # P1) = P(T1)
*
P(D1)
*
P(P1) = 1/5
*
1/7
*
1/2 =1/70
Ovako konstruiranu tablicu možemo koristiti za zaključivanje o vrijednostima združenih vjerojatnosti,
ali nam u slučaju jednolike distribucije vjerojatnosti ona neće biti od velike koristi. Međutim, ne moraju
svi događaji biti jednako vjerojatni. Uvedimo sada sljedeće iskustvo na primjer, pljačke su duplo češće
petkom. To znači da će u stupcu D5 vrijednosti biti duplo veće od ostalih stupaca. U tom slučaju dobit
ćemo nejednoliku distribuciju tako da vrijednosti u stupcu D5 povećamo, ali i u svim ostalim stupcima
smanjimo vrijednosti vodeći pritom računa da ukupna suma vjerojatnosti mora ostati 1.
Tablica 5-7. Tablica u kojoj definiramo združene vjerojatnosti dodavanjem i treće varijable
5 ZAKLJUČIVANJE I RASUĐIVANJE
157
Tablica 5-8. Modifikacije tablice združenih vjerojatnosti uvođenjem iskustvenog pravila da su pljačke
duplo češće petkom
Uvedimo i novu heuristiku pljačkaši P1 preferiraju T2, a pljačkaši P2 češće pljačkaju T4.
Pojedina polja dobivaju veću vrijednost, a ostala manju jer ukupna suma mora uvijek imati vrijednost 1.
Tablica 5-9. Modifikacije tablice združenih vjerojatnosti uvođenjem heurističkih informacija o
pljačkama
Zadatak možemo još dodatno obogatiti novim heuristikama:
5 ZAKLJUČIVANJE I RASUĐIVANJE
158
Pljačkaši 1 subotom su u blizini T3, te T3 češće od P2 pljačkaju samo subotom.
T5 nedjeljom radi kraće tako da je period u kojem može biti opljačkana kraći.
U svakom slučaju, tablica združenih vjerojatnosti čuva nam distribuciju vrijednosti združenih
vjerojatnosti za sve vrijednosti i po svim varijablama domene.
Ukupan broj podataka koje ovakva tablica čuva ovisi o broju varijabli i njihovom broju vrijednosti.
Za našu tablicu bilo nam je potrebno 5
*
7
*
2 = 70 podataka. To znači da je za potpunu definiciju tablice
združenih vjerojatnosti za ovakav sustav s 3 varijable potrebno individualno pohraniti 70 vrijednosti. S
povećanjem broja varijabli eksponencijalno se povećava broj ulaza. Kažemo da imamo eksponencijalnu
eksploziju broja vrijednosti povećanjem broja varijabli. Eksponencijalni rast u računarstvu je uvijek
nepoželjan jer se vrlo brzo dosegne količina podataka koja premašuje memoriju računala. Dakle, potrebno
je smisliti način kako smanjiti broj varijabli.
Ako još ubacimo i varijablu sunčan_dan, tada dobijemo još jednu dimenziju i imamo ukupno 5
*
7
*
2
*
2 = 140 podataka. Međutim, poznavajući dobro domenu koja u našem slučaju predstavlja običaje
pljačkaša, možemo tvrditi da je jednaka vjerojatnost pljačke na sunčan dan kao i na ostale dane (tj.
vjerojatnost pljačke ne ovisi o tome je li dan sunčan), te tada informaciju o sunčanom danu možemo
isključiti iz naše tablice: (P, D, T, S)
®
(P,D,T) , (S) zato što su ti događaji nezavisni.
5.2.6 Bayesove mreže
Bayesova mreža je usmjereni graf koji se sastoji od čvorova i lukova, a svaki čvor nosi
informaciju o uvjetnim vjerojatnostima. Čvorovi su određeni skupom slučajnih varijabli koje mogu biti
diskretne ili kontinuirane. "Strelice povezuju dva čvora na način da su strelice usmjerene od čvora roditelj
prema čvoru dijete. Svaki čvor nosi informaciju o uvjetnoj vjerojatnosti gdje su uvjeti roditeljski čvorovi
P(X | parent(X)). Graf nema usmjerenih zatvorenih ciklusa, prema tome je usmjereni aciklički graf
(engl. DAG Directed Acylic Graph). Bayesove mreže smanjuju broj varijabli koje je potrebno poznavati
da bismo definirali sustav koji opisujemo te su značajno bolje za praktične primjene od tablica združenih
vjerojatnosti.
D-separacija
Grafički modeli omogućavaju direktno iščitavanje svojstava uvjetne nezavisnosti iz strukture
grafa bez ikakvih analiza, korištenjem okvira koji nazivamo d-separacija gdje oznaka d dolazi iz
engleske riječi directed što znači usmjerena. Povezanosti u Bayesovim mrežama mogu biti
konvergirajuće (2 uzroka ® 1 posljedica), divergirajuće (1 uzrok ® 2 posljedice) i serijske ( uzrok ®
posljedica1 = uzrok2 ® posljedica2).
Konvergirajuća veza
Kod konvergirajuće veze imamo koncept povezanosti gdje više uzroka ima istu posljedicu. Uzroci
su nezavisni, kao što je npr. sunčan dan i upaljeno grijanje potpuno nezavisno, ali ako imamo podatak o
posljedici, tj. imamo dokaz da je toplo u prostoriji, vjerojatnost da je sunčano i vjerojatnost da je toplo više
nisu nezavisne.
Slika 5-3. Konvergirajuća mreža
Divergirajuća veza
5 ZAKLJUČIVANJE I RASUĐIVANJE
159
Vrijednost varijabli svijetlo i toplina su ovisne. Ako znamo da je svijetlo, veća je vjerojatnost i da
je toplo. Ako je mračno, vjerojatnije je da nije toplo. Međutim, ako je dana informacija da je sunčano,
vrijednost varijable svijetlo nezavisna je o varijabli toplo i obrnuto. Ovaj primjer predstavlja klasičnu
situaciju uvjetne nezavisnosti gdje su varijable svijetlo i toplo uvjetno nezavisne u prisutnosti dokaza
sunčano.
Slika 5-4. Divergirajuća mreža
Serijska veza
Serijski vezane varijable su ovisne na primjer za dobru_fotografiju treba svijetlo, a ono će biti ako
je sunčano. No ako nam je dana vrijednost varijable svijetlo, više nije bitna varijabla sunčano, zato što
dobra_fotografija ne ovisi direktno o njoj.
Slika 5-5. Serijska veza
Primjer Bayesove mreže za profiliranje kriminalaca
Krenimo primjerom jednostavne Bayesove mreže za profiliranje kriminalaca. Mrežu kreiramo na
način da:
prebrojimo varijable
povežemo ih vezama"
kreiramo tablice uvjetne vjerojatnosti.
U našem slučaju imamo 7 varijabli, pa bi nam kod kreiranja tablice združenih vjerojatnosti
trebalo ukupno 2
7
=128 unosa, a za Bayesovu mrežu treba nam samo 1+1+1+2
3
+ 2
3
+ 2
2
+2
2
= 27 unosa.
Pokazat ćemo kako se definira tablica uvjetne vjerojatnosti za dio mreže za profiliranje kriminalaca
prikazane na slici 5-7 s tablicom za sve vrijednosti uvjetnih varijabli koje su najčešće samo binarne (1 ili
0). Za opis ovakve mreže potrebno je definirati 2 a priori vjerojatnosti i 2 uvjetne vjerojatnosti:
P(neobrazovan), P(obitelj), P(pljačka | neobrazovan, obitelj), P(zatvor | pljačka)
U tablicama + znači da je odgovor potvrdan, a da je negativan. Na primjer, uvjetna vjerojatnost
da se dogodi pljačka ako je pljačkaš neobrazovan (+n) i nema obitelj (-o) je 0,7, a vjerojatnost da pljačkaš
ode u zatvor ako je napravio pljačku (+p) je 0,6. Na ovoj Bayesovoj mreži ilustrirat ćemo postupak
vjerojatnosnog zaključivanja.
5 ZAKLJUČIVANJE I RASUĐIVANJE
160
Slika 5-6. Bayesova mreža za profiliranje kriminalaca
Slika 5-7. Dio Bayesove mreže za profiliranje kriminalaca sa svim uvjetnim vjerojatnostima
Zaključivanje u Bayesovim mrežama
Zaključivanje ima za cilj za dane ulazne podatke dati odgovor na postavljena pitanja (upite). Na
primjer, možemo pitati: Ako netko ide u zatvor, kolika je vjerojatnost da je neobrazovan? Rezultat treba
biti uvjetna vjerojatnost P(+n|+z). Varijabla zatvor je varijabla dokaza (engl. Evidence), a neobrazovan
je varijabla upita (engl. Query), dok su sve ostale varijable iz modela skrivene varijable (engl.
Hidden). Drugi tip pitanja su koje su najvjerojatnije vrijednosti varijabli, ako su im dane vrijednosti
(engl. Maximum Likelihood). Na primjer: Kolika je vjerojatnost da netko ide u zatvor? Rezultat bi trebao
biti P(+z).
Zaključivanje u Bayesovim mrežama radi se raznim postupcima, od kojih ćemo ovdje opisati:
zaključivanje enumeracijom (nabrajanjem)
zaključivanje eliminacijom varijabli
zaključivanje uzorkovanjem.
Zaključivanje enumeracijom (nabrajanjem)
Postavljamo pitanje: Kolika je vjerojatnost da je netko neobrazovan ako ide u zatvor?
5 ZAKLJUČIVANJE I RASUĐIVANJE
161
Prema Bayesovim teoremu:
P(+n|+z) = P(+n,+z) / P(+z)
P(+z)je ukupna vjerojatnost odlaska u zatvor koja je konstantna, pa je ova uvjetna vjerojatnost
proporcionalna združenoj vjerojatnosti:
-2>*'>?4$8$
@@
-2>*'>?'A'B4$
3#
8
@@
-2>*4 C$-2B4C$-2$A$;$>*'B4C$-2>?$;$A4$
3#
8 -2>*4D
@
-2B4
3
D
@
-2A$;$>*$'B4C$-2>? $;$A4
#
Za vrijednosti sa slike 5-7 imamo
P(+n,+z) = P(+n)
C$2
P(+o)
C$2
P(+p| +n, +o)
C$
P(+z | +p) + P(-p| +n, +o)
C$
P(+z | -p)) + P(-o)
C$2
P(+p| +n, -o)
C$
P(+z | +p) + P(+p| +n, o)
C$
P(+z | p))) = 0,3
C$2E'F$C$2E'G$C$E'H$>$E'/$C$E'E&4$>$E'($C$2E'H$C$E'H$>$E'.$C$E'E&44$
=
E'.$C$2E'..I($>$E'EIFG4$
=
$E'&.&./$
Postupak enumeracije grafički se prikazuje evaluacijskim stablom koje za ovaj primjer
prikazuje slika 5-8.
Slika 5-8. Evaluacijsko stablo zaključivanja enumeracijom na Bayesovoj mreži sa slike 5-7
Ako je pitanje: Kolika je vjerojatnost da je netko obrazovan (nije neobrazovan) ako ide u zatvor?,
na sličan način dobijemo:
P(-n,+z) = P(n)
J
P(o)
J
P(p| n , o)
C$
P(+z | p) = 0,7
C$2E'F$C$2E'&$C$E'G$ >$E'I$C$E'E&4$> $E'($C$2E'($C$E'G$>$E'F$C$E'E&44$
= 0,7
C$2E'EKK($>$E'E(KG4$
=
$E'EKGKG$
Kako ovo možemo interpretirati? Prema ulaznim podacima neobrazovanih ima 30%, a
obrazovanih 70%. Međutim, bez obzira što je obrazovanih duplo više, vjerojatnost da će obrazovani
završiti u zatvoru je skoro tri puta manja. Zaključak se temelji na ulaznim podaci o pojedinim
vjerojatnostima (slika 5-7), a oni se dobivaju na temelju statističkih analiza stvarnih podataka.
Enumeracija je siguran način zaključivanja u Bayesovim mrežama, ali kod nje broj proračuna
može biti velik, pogotovo za složene mreže. Zbog toga su istraživači tražili postupke za ubrzavanje
enumeracije. Na primjer, posebnu pažnju treba posvetiti maksimiziranju nezavisnosti kod dizajna
Bayesove mreže. S manje veza između čvorova, Bayesova mreža je jednostavnija te proračuni kod
zaključivanja imaju manje operacija. Međutim, ukidanjem veza između čvorova možemo propustiti bitne
povezanosti među varijablama, Kažemo da prilikom dizajna Bayesove mreže radimo balans ili trgovinu
5 ZAKLJUČIVANJE I RASUĐIVANJE
162
(engl. Trade-off) između jednostavnosti i preciznosti. Algoritam enumeracije je intuitivan algoritam kojim
provodimo zaključivanje u Bayesovim mrežama. On ima svoju matematičku osnovu i sigurno nam daje
ispravno rješenje. Međutim, u slučaju složenijih mreža s većim brojem varijabli i gustim vezama,
proračuni su neučinkoviti te pribjegavamo drugim rješenjima.
Zaključivanje eliminacijom varijabli
Ponekad prilikom zaključivanja jedan dio mreže koristimo kao skrivene varijable te nam nije
potrebno prilikom svakog zaključivanja taj dio mreže ponovo reducirati. Razmotrimo pojednostavljenu
Bayesovu mrežu koju prikazuje slika 5-9. Zanima nas kolika je vjerojatnost da osoba završi u zatvoru.
Varijable iz mreže eliminiramo tako da združujemo dvije varijable (uzrok i posljedicu) u združenu
vjerojatnost dvaju događaja, a zatim računamo vjerojatnost posljedice nezavisno o uzroku. Postupak
eliminacije varijabli ilustriran je na slici 5-9.
Slika 5-9. Bayesova mreža kojom ilustriramo algoritam eliminacija varijabli
5 ZAKLJUČIVANJE I RASUĐIVANJE
163
Zaključivanje uzorkovanjem
Kada analitički postupci ne daju rezultate, možemo pribjeći tehnici uzorkovanja. Prirodni način
za određivanje vjerojatnosti pojedinih čvorova jest uzorkovanje
(engl. Sampling). Uzmimo za primjer
bacanje dvaju novčića. Uzastopnim bacanjem i pamćenjem rezultata (uzorkovanjem) odredit ćemo
vjerojatnosti pojedinih ishoda. Preciznost ovakvog zaključka ovisi o broju uzoraka. Što je veći broj
uzoraka, to je veća preciznost.
Slično možemo napraviti s Bayesovim mrežama za koje već imamo definirane tablice
vjerojatnosti. Uzmimo za primjer Bayesovu mrežu prikazanu na slici 5-7. Postupak započinjemo tako da
generiramo uzorak, počevši od varijabli koje nemaju roditelje. Na primjer za neobrazovan uzimamo
uzorak na način da generiramo slučajnu varijablu, s vjerojatnošću od 0,3 da bude pozitivna. Generiramo
varijablu koja je više vjerojatna, a to je da neobrazovan nije istinit koji ćemo označiti s n. "
Zatim generiramo slučajnu varijablu za obitelj i dobijemo pozitivnu vrijednost +o. Sljedeća
varijabla koju generiramo je pljačka. Kako vec7$ imamo n i +o, iz trećeg retka tablice vidimo da nam
varijabla p ima vjerojatnost 0,1 da bude pozitivna, odnosno 0,9 da bude negativna. Recimo da dobijemo
vrijednost p." Ostaje nam još samo varijabla zatvor. Kako imamo ograničenje p, vjerojatnost da
dobijemo pozitivnu vrijednost je 0,01, te je veća vjerojatnost da dobijemo vrijednost z." Set generiranih
vrijednosti (n, +o, p, z) je jedan uzorak. Postupak ponavljamo onoliko puta koliko želimo te iz broja
uzoraka možemo izračunati što nam treba.
Ako se upit sastoji od uvjeta, npr. P(+z | o) koji možemo interpretirati kolika je vjerojatnost da
ide u zatvor ako nema obitelj, tada od generiranih uzoraka odbacujemo one koji nisu u skladu s uvjetom,
tj. sve koji u sebi sadrže +o. "Ovo može biti problem, ako se radi o uvjetu koji je manje vjerojatan zato što
se velik broj generiranih uzoraka odbacuje, a troše se resursi na njihovo generiranje.
Rješenje je da u svakom uzorku držimo vrijednost uvjeta fiksnim, ali uzorku pridjeljujemo težinu
koja je u skladu s vjerojatnošću uvjeta (engl. Likelihood Weightning). Spomenimo još i Gibbsovo
uzorkovanje kod kojega se svaki novi uzorak razlikuje od prethodnog u samo jednoj varijabli, a varijable
dokaza ne diramo.
Naivni Bayesov klasifikator
Naivni Bayesov klasifikator (engl. Naive Bayes Classifier), ili kako se često zove vjerojatnosni
klasifikator (engl. Probabilistic Classifier),
je metoda nadziranog strojnog učenja kod kojeg se provodi
klasifikacija na temelju Bayesovog teorema uz (naivnu) pretpostavku nezavisnosti između događaja.
Strojno učenje detaljno obrađujemo u Poglavlju 6, a ovdje ćemo dati samo kratki uvod u način rada
naivnog Bayesovog klasifikatora. Ipak, prije toga ćemo reći par riječi o klasifikatorima i klasifikaciji.
Klasifikacija je primjer prepoznavanja uzoraka (engl. Pattern Recognition)
i vezana je s opservacijom
(opažanjem) podataka o uzorcima i određivanjem kojoj kategoriji pripada neki novoopservirani uzorak.
Klasifikacija se kod nadziranog strojnog učenja temelji na skupu podataka za treniranje kod kojeg je za
sve uzorke poznato kojoj kategoriji pripadaju. Ako se kod klasifikacije koriste statističke metode,
govorimo o statističkom klasifikatoru. Bayesov naivni klasifikator uz korištenje Bayesovog teorema
pretpostavlja i statističku nezavisnost između uzoraka. Iz uzoraka se izdvajaju značajke (engl. Features)
te se na temelju njih zaključuje kojoj kategoriji uzorak pripada.
Iako se radi o algoritmu strojnog učenja, naivni Bayesov klasifikator utemeljen je na Bayesovim
mrežama. Praktičnih primjena ima puno. Na primjer:" detekcija smeća” (engl. Spam) u elektroničkoj
pošti, "detekcija terorističkih poruka, zaključivanje radi li se o unutrašnjem ili vanjskom prostoru na
temelju karakteristika objekata na slici, automatsko prepoznavanje dima šumskog požara na slikama s
nadzornih kamera itd.
Zadatak 5. Naivni Bayesov klasifikator
Način djelovanja naivnog Bayesovog klasifikatora pokazat ćemo na primjeru automatske detekcija
terorističkih poruka. Primjer Bayesove mreže za ovaj primjer prikazuje slika 5-10.
5 ZAKLJUČIVANJE I RASUĐIVANJE
164
Slika 5-10. Struktura Bayesove mreže koju koristi naivni Bayesov klasifikator
Nadzirano strojno učenje podrazumijeva ulaz koji se sastoji od niza podataka kojima je naznačen
ispravan izlaz." U slučaju učenja prepoznavanja terorističkih poruka, ulaz je niz poruka od kojih su neke
označene kao terorističke, a ostale kao ne-terorističke”.
Tablica 5-10. Primjeri terorističkih (T) i ne-terorističkih (NT) poruka
Za odabir značajki koristit ćemo takozvanu vreću riječi(engl. Bag of Words), model koji uzima
za značajke pojedine riječi bez obzira na to gdje se u rečenici nalaze i prebrojava broj ponavljanja pojedine
riječi.
Tablica 5-11. Rječnik koji pokazuje učestalost pojavljivanja riječi u porukama
Iz ulaznih podataka prvo što možemo izračunati je vjerojatnost pojave terorističke (T) i ne-
terorističke (NT) poruke P(T)=2/5, P(NT)=3/5. Računamo sada uvjetnu vjerojatnost pojave pojedine
riječi, a da se radi o terorističkoj ili ne-terorističkoj poruci:
P(bombu|T) = 1/5
P(lokomotiva|T) = 0/5
P(lokomotiva|NT) = 1/10
Međutim, da bismo realizirali klasifikaciju poruka na terorističke i ne-terorističke, više nas
zanima zaključivanje u obrnutom smjeru. Primjerice, možemo izračunati P(T|postaviti), tj. kolika je
vjerojatnost da se radi o terorističkoj poruci ako ona sadrži riječ postaviti. Ova vrijednost predstavlja
osnovu klasifikatora, a računa se na sljedeći način:
-
2
L;ABMNOPQNQ
4
8
R2STUVWXYVY;Z4[R2Z4
R2STUVWXYVY4
=
!
"
#
"
#
!$
=
\]
^_
Na isti način možemo izračunati vjerojatnost da je poruka teroristička za sve pojedinačne riječi iz
poruke koju klasificiramo. Ukupna vjerojatnost pripadnosti klasi terorističkih porukaje združena
vjerojatnost za sve riječi. Naivni Bayesov klasifikator pretpostavlja da su sve riječi nezavisne jedna o
drugoj te se združena vjerojatnost dobije kao umnožak pojedinačnih vjerojatnosti za pojedinačne riječi.
5 ZAKLJUČIVANJE I RASUĐIVANJE
165
Pogledajmo što se događa kada nas zanima kolika je vjerojatnost da se u terorističkoj poruci pojavi
riječ bomba, a kolika da se pojave riječi bomba i lokomotiva istovremeno.
P(T|bomba)=P(bomba|T)!P(T) / P(bomba) =
= P(bomba|T)!P(T) / (P(bomba|T)
P(T)+ P(bomba| NT)!P(NT))=
=((1/2)!(2/5))/((1/5)!(2/5)+0!(3/5)) = 1
P(T |bomba,lokomotiva)= P(bomba,lokomotiva|T) !P(T)/P(bomba,lokomotiva) = P(bomba|T) !
P(lokomotiva|T) !P(T) / (P(bomba|T)!P(lokomotiva|T)P(T)+ P(bomba|NT)P(lokomotiva|NT)!
P(NT)) = 0
Vjerojatnost da se u terorističkoj poruci pojavi riječ bombaje 100%, a da se pojave riječi bomba
i lokomotivaje 0%. Ipak, znamo da u prirodi rijetko kada imamo događaje kojima je vjerojatnost 100%
ili 0%. Sustav ovakvog zaključivanja bio bi nam praktičniji kada bi vrlo vjerojatni događaji imali visoku
vjerojatnost, ali vrijednosti manje od 100%, a malo vjerojatni događaji imali ipak neku vjerojatnost veću
od 0%. Prisjetimo se da ukupnu vjerojatnost pripadnosti klasi računamo kao umnožak uvjetnih
vjerojatnosti pojedinačnih riječi, te znamo da će umnožak s 0 dati konačni rezultat 0, te će samo pojava
jedne riječi koja se pojavljuje u zapisima te klase u skupu za treniranje dati ukupnu vjerojatnost 0.
Laplaceovo zaglađivanje (engl. Laplace Smoothing)
ili aditivno zaglađivanje je postupak koji
se "koristi za zaglađivanje vjerojatnosti, tj. kako bismo smanjili utjecaj smetnji (tj. šuma (engl. Noise)).
Uvedimo najprije pojam maksimalne vjerojatnosti (engl. Maximum Likelihood)
koja odgovara
maksimalnoj vjerojatnost dobivanja niza podataka.
P(x) = broj_ pojava(x) / broj_uzoraka
Ovu jednadžbu obično proširujemo Laplaceovim zaglađivanjem:
P(x) = (broj_ pojava(x) + k) /
"
(broj_uzoraka + k !broj_ klasa)
gdje je k faktor zaglađivanja (k > 0, a ako je k = 0 nema zaglađivanja). Na primjer, ako imamo
jedan uzorak T, dobijemo:
Prema maksimalnoj vjerojatnosti: P(T) = 1/1 = 1.
Prema Laplaceovom zaglađivanju za k=1: P(T) = (1+k)/(1+k
!
2) = 2/3.
Na ovaj način dobili smo nove vrijednosti procjene vjerojatnosti događaja temeljem skupa
podataka koje su manje podložne utjecaju ekstremnih situacija poput događaja kod kojih nemamo zapisa
u skupu podataka ili imamo mali broj uzoraka.
Skriveni Markovljevi modeli
Skriveni Markovljevi
85
modeli (engl. HMM Hidden Markov Models)
koriste se za analizu ili
predviđanje promjena stanja kroz vrijeme, pa oni u biti predstavljaju dinamičku Bayesovu mrežu. Zanima
nas kako će se stanja razvijati kroz slijed diskretnih trenutaka:
X1
®
X2
®
X3
®
X4
®
...
®
Xn
Postoji puno praktičnih primjena skrivenih Markovljevih modela, od robotike, medicine, obrade
govora, predviđanja kretanja financijskog tržišta do jednostavnih primjena (npr. u vođenju dizala). "
Centralni dio skrivenih Markovljevih modela je Bayesova mreža koja se sastoji od niza stanja, a svako
stanje ovisi samo o jednom prethodnom stanju i o mjerenjima koji su vidljivi dokazi individualnih stanja.
"Informacija o stanju su mjerenja z, a stvarna stanja X su skrivena, pa se zato u nazivu nalazi riječ
skriveni. O stvarnim stanjima zaključujemo samo na temelju izmjerenih vrijednosti (slika 5-13).
85
Ime su dobili po ruskom znanstveniku Andreyu Andreyevichu Markovu (1856.1922.)
5 ZAKLJUČIVANJE I RASUĐIVANJE
166
Slika 5-13. Kod skrivenih Markovljevih modela o stanjima X
i
zaključujemo
na temelju mjerenja z
i
Pogledajmo najprije nešto jednostavniji koncept Markovljev lanac (engl. Markov Chain).
Markovljev lanac je niz stanja kod kojeg prelazak u novo stanje ovisi samo o prethodnom stanju. Na
primjer: kupci u trgovini plaćaju gotovinom (G) ili karticom (K). Pretpostavimo da vrijedi sljedeće: Ako
je kupac platio gotovinom, vjerojatnost da će sljedeći platiti gotovinom je 0,6, a karticom 0,4. Ako je kupac
platio karticom, sljedeći će kupac s vjerojatnošću 0,8 platiti karticom, dok je vjerojatnost 0,2 da će sljedeći
kupac platiti gotovinom.Markovljev lanac prikazuje slika 5-14.
Zanima nas ako je prvi kupac platio gotovinom, kolika je vjerojatnost da će drugi kupac također
platiti gotovinom?
P(G0 ) = 1
"
P(G1) = ?
"
P(G1) = P(G1|G0) !P(G0) + P(G1|K0) ! P(K0) = 0,6 !1 + 0,4 !0 = 0,6
a vjerojatnost da će platiti karticom je P(K1) = 0,4
"
Slika 5-14. Markovljev lanac jednostavne situacije plaćanja gotovinom (G) ili karticom (K) u dva
plaćanja koja slijede jedan iza drugoga
Kolika je vjerojatnost da će i treći kupac platiti gotovinom?
P(G2) = ?
P(G2) = P(G2|G1)
!
P(G1) + P(G2|K1)
!
P(K1) = 0,6
!
0,6 + 0,4
!
0,4 = 0,52
Može nas na primjer i zanimati: Postoji li stacionarno stanje, vjerojatnost da će u beskonačnosti
kupac platiti gotovinom?
P(G
`
) = ?
Za stacionarno stanje vrijedi da je:
P(Gt)= P(Gt-1)
P(Gt)= P(Gt|Gt-1)
!
P(Gt-1) + P(Gt|Kt-1)
!
P(Kt-1)
X=0,6
!
X + 0,4
!
(1X)
X=0,5
5 ZAKLJUČIVANJE I RASUĐIVANJE
167
Promotrimo sada kako se projektira Markovljev model. U prethodnom primjeru smo pretpostavili
da su nam poznate sve vjerojatnosti Markovljevog lanca s slike 5-14. A kako smo do njih došli? Kako
popuniti vjerojatnosti u Markovljevom lancu? Jedan od načina je korištenjem maksimalne vjerojatnosti.
Za početak nam treba eksperimentalno dobiven vremenski niz. Stali smo pokraj blagajne i bilježili kako
kupci plaćaju. Pretpostavimo da smo dobili vremenski niz GKKKGKG. "Zatim je potrebno popuniti
vjerojatnosti prijelaza s onim vrijednostima koje nam pružaju najveću vjerojatnost da za uzorak dobijemo
upravo ovakav niz stanja. Iz niza možemo zaključiti sljedeće:
Ukupno imamo 6 sukcesivnih plaćanja, od toga je kod 2 plaćanja prvo bilo plaćanje gotovinom
(G), a kod 4 plaćanje je najprije bilo plaćanje karticom (K). Prvo je plaćanje bilo gotovinom
P(G0)=1.
Nakon plaćanja gotovinom, nikada nije u sljedećem plaćanju ponovo plaćeno gotovinom -
P(G|G)=0/2=0.
Nakon plaćanja gotovinom uvijek je sljedeće plaćanje bilo karticom - P(K|G)=2/2=1.
Nakon plaćanja karticom u 2 slučaja je sljedeće plaćanje bilo gotovinom, a u dva karticom -
P(G|K)=2/4=0,5 i P(K|K)=2/4=0,5.
Kako bi se smanjio utjecaj smetnji, i ovdje možemo koristiti Laplacevo zaglađivanje. Uz k = 1
imamo:
P(G0)=(1+1)/(1+2)=2/3
P(G|G)=(0+1)(2+2)=1/4
P(K|G)=(2+1)/(2+2)=3/4
P(G|K)= P(K|K)=(2+1)/(4+2)=3/6
Vratimo se sada na skrivene Markovljeve modele. Zamislimo da ne možemo izravno vidjeti
plaća li kupac gotovinom ili karticom jer nam je kupac okrenut leđima, već vidimo samo trgovca. Međutim
znamo da ako kupac plaća gotovinom, trgovac će se nasmijati u 90% slučajeva, dok će se nasmijati u 40%
slučajeva kada kupac plaća karticom. Samo stanje nam je skriveno, ali na temelju posrednih podataka
(osmijeh trgovca) pokušavamo zaključiti stvarno stanje skrivenih stanja. Model prikazuje slika 5-15.
Slika 5-15. Skriveni Markovljev model situacije plaćanja gotovinom (G) ili karticom (K). N je
vjerojatnost da se trgovac osmjehnuo kada je kupac platio gotovinom ili karticom, a O je vjerojatnost da
se trgovac nije osmjehnuo, a kupac je platio karticom ili gotovinom.
Ovo je skriveni Markovljev model situacije plaćanja u trgovini pomoću kojega, samo promatrajući
osmijehe trgovca, možemo procijeniti stanje gotovine u blagajni. Ako znamo da je a priori vjerojatnost
plaćanja gotovinom 0,5 i imamo opservaciju da se trgovac nasmijao, možemo izračunati vjerojatnost da je
kupac platio gotovinom koristeći Bayesovu formulu.
P(G|N) = P(N|G)
!
P(G) /P(N) = (P(N|G)
!
P(G))/(P(N|G)
!
P(G) + P(N|K)
!
P(K))=
= (0,9
!
0,5)/(0,9
!
0,5 + 0,4
!
0,5) = 0,7
5 ZAKLJUČIVANJE I RASUĐIVANJE
168
P(G|N) je vjerojatnost da je kupac platio gotovinom uz to što se trgovac i nasmijao, P(N|G) je
vjerojatnost da će se trgovac nasmijati ako kupac plati gotovinom, a P(G) je a priori vjerojatnost da će
kupac platiti gotovinom. Zaključak je da je uz osmjeh prodavača povećana vjerojatnost da je kupac platio
gotovinom. Skriveni Markovljevi modeli važan su dio algoritama za lokalizaciju robota ili automatske
vožnje automobila koji sam vozi.
5.2.7 Klasifikator neosporne konfabulacije
Klasifikator neosporne konfabulacije (engl. Cogent Confabulation Classifier)
je malo
drugačiji od naivnog Bayesovog klasifikatora, a nastao je kao rezultat istraživanja načina kako čovjek
zaključuje i rasuđuje. Dio je teorije mehanizma razmišljanja (engl. The Mechanism of Thought)
(Hecht-Nielsen, 2005, 2006), a odlikuje ga jednostavna implementacija i brzo računanje. Slično kao i
Bayesov teorem neosporna konfabulacija nastoji modelirati induktivno zaključivanje i generalizirati
Aristotelovu implikaciju
a,b,c,d a e, gdje su a, b, c i d četiri različite pretpostavke (premise) na temelju kojih se donosi zaključak
e. Ako postoje vjerojatnosti pojave a,b,c,d, uz pretpostavku da će se događaj e dogoditi, vjerojatnost
događaja e može se izraziti Bayesovim teoremom kao a posteriori vjerojatnost p(e|abcd) definirana
jednadžbom:
p(e|a,b,c,d) = p(a,b,c,d|e)
.
p(e)/p(a,b,c,d )=
= p(a|b,c,d,e)
.
p(b|c,d,e)
.
p(c|d,e)
.
p(d|e)/(p(a|b,c,d)
.
p(b|c,d)
.
p(c|d)
.
p(d)) (5-27)
U teoriji neosporne konfabulacije pristup je potpuno okrenut, te se traži složena uvjetna
vjerojatnost p(a,b,c,d|e) da se uz događaj e pojave i pretpostavke a,b,c,d. U teoriji neosporne konfabulacije
p(a,b,c,d|e) se naziva neospornost (engl. Cogency). Teorija smatra da se proces donošenja odluka kod
ljudi temelji na izboru zaključka koji je najviše podržan istinitim pretpostavkama. Autor teorije Hecht-
Nielsen ovu je ideju ilustrirao pričom (Hecht-Nielsen, 2005): ako stvorenje veličine patke sliči na patku,
hoda kao patka, pliva poput patke i leti poput patke (premise a,b,c,d), onda ga prihvaćamo kao patku, zato
što je patka (e), simbol koji, kad se vidi, najjače podupire vjerojatnost da su te premise istinite i maksimira
p(a,b,c,d | e).
Bayesov pristup potpuno je drugačiji, zbog toga što on sugerira da se izabere događaj e koji ima
maksimalnu a posteriori vjerojatnost p(e|a,b,c,d), uz prisutne premise a,b,c,d. Ovo je, prema teoriji
neosporne konfabulacije, pogrešan opis ljudskog načina donošenja zaključaka kojeg Hecht-Nielsen
ilustrira jednostavnim primjerom danim u nastavku teksta.
Primjer pogrešnog zaključivanja Bayesovim teoremom
Pretpostavimo da za premise a,b,c,d postoje dva moguća zaključka e i f koji imaju a priori
vjerojatnosti pojavljivanja p(e) = 0,01 i p(f) = 0,0001, što znači da je 10 puta veća vjerojatnost da se dogodi
e nego f, ili kazano na drugi način, u skupu testnih podataka e se pojavio 10 puta više nego f. Uzmimo kao
primjer sliku 4-8 koja prikazuje dim šumskog požara i neka je događaj e = pojava kuće na slici, a događaj
f = pojava dima na slici. Prema a priori vjerojatnostima na svakih 100 slika na jednoj će se pojaviti
kuća, a na svakih 10.000 slika na jednoj će se pojaviti dim. Dim je puno rjeđa pojava nego kuća.
Pretpostavimo sada da imamo kombinaciju svojstava a,b,c,d koja se kod pojave e javljaju s uvjetnom
vjerojatnosti p(a,b,c,d |e) = 0,01 (na 100 pojava događaja tipa e samo 1 ima kombinaciju a,b,c,d), a kod
pojave f s uvjetnom vjerojatnosti p(a,b,c,d|f) = 0,2 (na sto događaja tipa f njih 20 ima kombinaciju a,b,c,d).
Prema Bayesovom teoremu ako na slici primijetimo kombinaciju a,b,c,d vjerojatnost da se radi o
zaključku e je čak 5 puta veća od vjerojatnosti da se radi o zaključku f
A2b$;O'c'd'e4f$A2g$;O'c'd'e4$$8!
A2O'c'd'e$;b4$D$$A2b4$fA2O'c'd'e4
A2O'c'd'e$;g4$D$$A2g4$fA2O'c'd'e4
8 $E'E& $E'E&fE'($ $E'EEE&$ 8 $K$
pa bi po Bayesu, svaki put kada bi se javila kombinacija a,b,c,d, zaključak bio da se radi o pojavi e (kući),
što se ne slaže s našim zdravim razumom. Kombinacija a,b,c,d je čak 20 puta češća kod događaja f (dima),
ali samo zato što je on rjeđi, Bayesov teorem ne izabire njega, već zaključak e.
Zaključivanje na temelju neosporne konfabulacije izabire onaj zaključak koji ima veću uvjetnu
vjerojatnost (neospornost). U ovom su primjeru uvjetne vjerojatnosti p(a,b,c,d |e) i p(a,b,c,d |f) bile
5 ZAKLJUČIVANJE I RASUĐIVANJE
169
zadane, pa kako je p(a,b,c,d |f) 20 puta veći, za zaključak bi bio odabran f, što se i slaže s našim zdravim
razumom.
Kod nas su uvjetne vjerojatnosti bile zadane, no u realnoj situaciji one se trebaju odrediti, ali je
do njih je vrlo teško doći. Zbog toga se u okviru teorije neosporne konfabulacije stvarna uvjetna
vjerojatnost aproksimira jednadžbom:
p(a,b,c,d|e)
4
h
K
.
p(a|e)
.
p(b|e)
.
p(c|e)
.
p(d|e) (5-28)
gdje je K konstanta. Jednadžba vrijedi za (naivnu) pretpostavku nezavisnosti između premisa a, b, c i d i
sugerira da će složena uvjetna vjerojatnost (neospornost) biti najveća ako je produkt uvjetnih vjerojatnosti
p(a|e)
.
p(b|e)
.
p(c|e)
.
p(d|e) najveći. Produkt vjerojatnosti
p(a|e)
.
p(b|e)
.
p(c|e)
.
p(d|e) se naziva
konfabulacija (engl. Confabulation), pa se u biti neospornost p(a,b,c,d|e) niti ne računa. Za dva moguća
zaključka e i f računaju se konfabulacije Con(e) = p(a|e)
.
p(b|e)
.
p(c|e)
.
p(d|e) i Con(f)= p(a|f)
.
p(b|f)
.
p(c|f)
.
p(d|f), te se odabire onaj zaključak čija je konfabulacija veća. Postupak predstavlja primjenu
strategije pobjednik nosi sve (engl. Winer-takes-all Strategy)
koja je prema teoriji mehanizma
razmišljanja upravo način na koji ljudi donose odluke.
Do uvjetnih vjerojatnosti tipa p(a|e) ili p(a|f) nije teško doći. Na primjeru sa slike 4-8 već smo
pokazali kako se npr. računa uvjetna vjerojatnost da neka kombinacija boja na slici pripada dimu, a i u
poglavlju 5.2.2 je o uvjetnoj vjerojatnosti dosta kazano. Upravo zbog toga klasifikator neosporne
konfabulacije nalazi sve više praktičnih primjena.
5.3 Neizrazito zaključivanje i rasuđivanje
Realnost stvarnog svijeta, problem je koji je stoljećima zaokupljao filozofe i znanstvenike: Što je
realnost? Kako je definirati i opisati? Činjenica je da je realnost uvijek neprecizna i nesigurna. Ona je
najčešće kaotična, dinamička, promjenjiva, nepredvidiva i obično izvan mogućnosti definiranja u
obzorima tradicionalnog razmišljanja. Ipak, mi živimo u realnosti i stvaramo u realnosti, pa nas to potiče
na razmišljanje kako to da mi ljudi (relativno) uspješno funkcioniramo u takvom okružju.
Kako uspijevamo voziti automobil i prilagoditi se stalno promjenjivoj i nepredvidivoj okolini? Kako
uspijevamo svakodnevno djelovati ne poznavajući precizno i detaljno što se oko nas događa? Mi ovisimo o
realnosti, realnost je rezultat naših akcija. I kako onda formalno opisati realnost, kako je uključiti u
tehničke i tehnološke sustave koji su u potpunosti proizvod čovjeka, a trebaju djelovati u realnom svijetu?
Kako izgraditi sustav vođenja koji će samostalno voditi automobil ili vlak? Kako predvidjeti urod i u
slučaju kada nemamo iskusnog poljoprivrednika? Kako procijeniti razvoj vremena i bez iskusnog
prognostičara i bez preciznih meteoroloških podataka, automatski, uz pomoć računala na način kako su
to stoljećima radili iskusni ribari i pomorci?
Upravo su ova pitanja 1965. godine navela Lotfija Zadeha da pokuša objasniti, opisati i
definirati nepredvidivost i nejasnost realnog svijeta uvodeći novi hibridni način razmišljanja nazvan
neizrazita teorija skupova, a kasnije jednim dijelom i neizrazita logika. Spominjali smo je već u
poglavlju 4.3.3 o nestandardnim logikama. Na Zadehovim idejama tijekom proteklih 50-ak godina izrasla
je cijela tehnologija i industrija. Ona se danas u potpunosti potvrdila, ne samo kao dobra teorija za opis
realnog svijeta, ne samo kao logički sustav koji je (za sada) najbliži logičkom sustavu ljudskog mozga, već
i kao izrazito primjenjiva tehnika u brojnim ljudskim djelatnostima. Svjetska industrija bilježi stotine
primjena neizrazite logike, od automatskog vođenja rotacione peći za proizvodnju cementa i automatskog
vođenja vlaka do predviđanja rizika potresa i burzovnih trendova. Suvremena industrija u turbulentnoj
okolini realnog svijeta danas je nezamisliva bez neizrazite logike. U ovom nas dijelu posebno zanima kako
se donose zaključci i provodi rasuđivanje u duhu neizrazite logike.
Neizrazito zaključivanje je tehnika računanja bez preciznih matematičkih jednadžbi i formula.
Umjesto detaljnog matematičkog definiranja zadataka, neizrazito zaključivanje omogućava opisivanje
zadataka koristeći približne i aproksimativne vrijednosti i opise slične onima koje čovjek koristi kada
govorom opisuje zadatak drugom čovjeku. Primjerice, precizni opis zadatka prilagodbe brzine automobila
bi bio:
Ako je brzina 105 km/h, počni kočiti 123 m prije raskrižja.
5 ZAKLJUČIVANJE I RASUĐIVANJE
170
što sigurno nije način kako bi ga čovjek u svakodnevnom, realnom životu opisao. Njegovom načinu
izražavanja puno je bliži opis:
Ako je brzina oko 100 km/h, počni kočiti stotinjak metara od raskrižja.
gdje su oko 100 km/h i stotinjak približni, aproksimativni opisi vrijednosti brzine i udaljenosti.
Prva je izjava previše precizna da bi bila primjenjiva u svakodnevnoj ljudskoj komunikaciji.
Neprecizne, približne upute izražene riječima prirodnog jezika puno su primjenjivije u svakodnevnom
realnom životu. Formalni prikaz približnih, nepreciznih vrijednosti, primjerice oko 100, jako visoko,
vrlo sporo, središnji je dio teorije lingvističke aproksimacije koja se izravno naslanja na neizrazitu
teoriju skupova i neizrazitu logiku. Već smo u dijelu o neizrazitoj logici spomenuli da su logika i teorija
skupova usko povezane. Teoriju skupova možemo promatrati kao grafičku vizualizaciju logike, pa kako
se Zadeh u prvim radovima o lingvističkoj aproksimaciji koristio neizrazitim skupovima, tako ćemo i mi
u nastavku koristiti tu notaciju.
5.3.1 Lingvistička aproksimacija neizrazitim skupovima
Pojam neizrazitog skupa (engl. Fuzzy Set)
nastao je poopćavanjem pojma klasičnog,
standardnog skupa. Klasični skup (engl. Crisp Set) sadrži elemente (objekte) koji precizno zadovoljavaju
uvjete zadanog skupa. Primjerice, skup brojeva A od 5 do 8 uključuje sve realne brojeve iz intervala [5,8].
Formalno ga definirano pridružnom (karakterističnom ili pripadajućom) funkcijom (engl. Membership
Function)
koja svakom elementu skupa pridružuje vrijednost 1 ako on pripada skupu, a vrijednost 0 ako
ne pripada skupu. Označimo li pridruženu funkciju skupa A oznakom m
A
, njena formalna definicija bi
bila:
m
A
: Ω
® {0,1}
(5-29)
gdje je Ω definicijski skup skupa A, skup na kojem je skup A definiran. Za prije spomenuti skup A realnih
brojeva od 5 do 8, definicijski skup Ω je skup realnih brojeva
i
pa skup A možemo formalno opisati
pridruženom funkcijom:
j
4
2
k
4
8
l
&$$?O$$K m k m F
E$$$$$?O$BMNOnb$k
o
gdje je r
p
i
. Jezično ga interpretiramo: Skup A čine svi realni brojevi između 5 i 8, zato je vrijednost
njihove pridružne funkcije jednaka 1”. Stavimo li na apscisu definicijski skup
i
, a na ordinatu vrijednost
pridružne funkcije m, skup A možemo prikazati crtežom na slici 5-16 lijevo.
Svaki realni broj r je ili u A ili nije u A. Pridružna funkcija m
A
pridružuje svim realnim
brojevima r jednu od dvije moguće vrijednosti 0 ili 1, pa upravo zbog toga klasični skup odgovara klasičnoj
dvovaljanoj logici: da ili ne, 1 ili 0, bijelo ili crno. U logici vrijednosti pridružne funkcije m
A
zovu se
vrijednosti istinitosti u odnosu na pitanje: Je li realni broj r u A ?. Odgovor je DA, tvrdnja je istinita,
onda i samo onda ako je m
A
(r) = 1, u ostalim slučajevima kada je m
A
(r) = 0 tvrdnja je lažna. Trećeg
nema.jedan je od temeljnih postulata, kako klasične logike tako i klasične teorije skupova. On je i razlog
zašto se klasičnim logičkim sustavom ne može opisati nesavršenost i nepreciznost realnog svijeta.
Slika 5-16. (Lijevo) Pridružna funkcija običnog skupa brojevi od 5 do 8. (Desno) Pridružna funkcija
neizrazitih skupova brojevi oko 7(i) i brojevi oko 3 i manje(ii)
5 ZAKLJUČIVANJE I RASUĐIVANJE
171
Realni svijet nije crno-bijel, bio bi previše jednostavan da jest, realni je svijet siv, ponekad više
bijel, ponekad više crn. Čovjek nije ili zločest ili dobar, dobrota svakog pojedinog čovjeka je negdje na
ljestvici između ta dva ekstrema. Netko je samo dosta dobar, netko je jako dobar, a netko i jako, jako
dobar. Sve su to neizraziti skupovi, a Zadeh ih je formalno definirao na način da je proširio pojam
pridružne funkcije i dozvolio da ona može poprimiti bilo koju vrijednost između ekstrema 0 i 1. Formalno
izraženo ona može imati bilo koju vrijednost iz intervala [0;1]. Kako bismo istaknuli razlike, ovu novu
pridružnu funkciju označit ćemo s μ, a neizraziti skup s A* pa se pridružna funkcija neizrazitog skupa
definira s:
μ
A*
: Ω
® [0,1]
(5-30)
U ovom izrazu 0 i 1 su uključeni u moguće vrijednosti pridružne funkcije, pa je klasični skup samo
poseban slučaj neizrazitog skupa. Vratimo se našem primjeru brojčanih vrijednosti te želimo prikazati
vrijednosti oko 7
. Pojam oko 7
nije precizan, on iskazuje nepreciznu vrijednost Ako ga definiramo
klasičnim skupom i klasičnom pridružnom funkcijom (5-29), prikazujemo ga slikom 5-16 (lijevo). Prema
njoj svi brojevi od 5 do 8 pripadaju pojmu"oko 7
s istom maksimalnom vrijednosti pridružne funkcije.
Puno bliže našem intuitivnom shvaćanju pojma oko 7
bila bi pridružnu funkciju prikazati krivuljom (i)
sa slike 5-16 (desno). Prema njoj broj 7 sigurno pripada pojmu oko 7
, pa smo mu pridružili vrijednost
pridružene funkcije 1, dok brojevima s lijeve i desne strane broja 7 pripadaju manje vrijednost pridružne
funkcije i to što su dalje vrijednost pridružne funkcije je manja. Prikaz pojma oko 7 krivuljom (i) sa slike
5-16 (desno) jedna je od mogućnosti definiranja tog pojma. Netko drugi bi kazao da treba proširiti granice,
ili ih smanjiti, ili svim vrijednostima skupa
i
dati neku vrijednost pridružene funkcije. Pojam oko 7
nazivamo neizraziti skup i simbolički ga obično označavamo ga A*, dodavši * kako bismo naglasili razliku
između neizrazitog i običnog skupa. Izraz oko 7 je njegov opis, njegova jezična vrijednost, a krivulja (i)
sa slike 5-16 (desno) jedan od načina njegovog matematičkog definiranja mogućih prikaza. Za razliku od
klasičnog skupa koji uvijek ima jedinstvenu pridruženu funkciju, svaki neizraziti skup može se prikazati
s beskonačno mnogo različitih pridruženih funkcija. Definicija neizrazitog skupa nije jednoznačna, ali
nije ni proizvoljna. Definicija pridružene funkcije treba se poklapati s našim intuitivnim shvaćanjem
pojma koji se definira. Primjerice, sigurno nitko ne bi neizraziti skup oko 7
prikazao pridruženom
funkcijom (ii) sa slike 5-16 (desno). Ta bi pridružena funkcija više odgovarala neizrazitom skupu
definiranom pojmom brojevi oko 3 i manji
.
Iako možda na prvi pogled izgleda da je višeznačnost definiranja neizrazitog skupa slabost teorije
neizrazitih skupova, to je u stvari njezina prednost. Žrtvovanjem jednoznačnosti dobije se fleksibilnost i
mogućnost da se neizraziti skup maksimalno prilagodi stvarnoj situaciji i kontekstu u kojem se definira.
Pojam velika temperaturasigurno će imati drugačije vrijednosti i granice ako se odnosi na temperaturu
čovjeka ili temperaturu goruće zone rotacijske peći za proizvodnju cementa.
Definiranje pridružne funkcije neizrazitog skupa izrazom (5-30) omogućava postupni,
kontinuirani prijelaz između pripadnosti i nepripadnosti određenom skupu. Posljedica takvog pristupa je
da neizrazita logika nema samo dvije vrijednosti istinitosti, već beskonačno vrijednosti istinitosti o čemu
smo već govorili u poglavlju 4.3.3. Odgovor na upit: Je li realni broj r u A ?sada glasi: Da, djelomično
sa stupnjem pripadnosti μ
A*
(r). Primjerice, ako je r = 6, a A* definiran krivuljom (i) na slici 5-16 (desno),
kažemo: Stupanj istinitosti da realni broj 6 pripada neizrazitom skupu 'oko 7' je 0,6.
Neizrazito zaključivanje i rasuđivanje temelji se na računanju s neizrazitim skupovima i
neizrazitim relacijama. Kod definiranja neizrazitih skupova osim fleksibilnosti granica dozvoljava se i
preklapanje granica. Primjerice, slika 5-17 prikazuje pridružene funkcije pojmova visok čovjeki nizak
čovjekdefiniranih klasičnim skupom i neizrazitim skupom.
Važno je uočiti oštar prijelaz između niskih i visokih u slučaju klasične definicije. Svi ljudi ispod
1,8 m su niski, a svi ljudi iznad 1,8 m su visoki. Neizrazita definicija dozvoljava postupni prijelaz uz
preklapanje. To znači da je čovjek visok 1,8 m visoksa stupnjem pripadnosti 0,5, ali u isto vrijeme i
nizaksa stupnjem pripadnosti 0,5, on je negdje na sredini prijelaza između niskog i visokog. S druge
strane čovjek visok 2 m pripada skupini visokih ljudi sa stupnjem pripadnosti 0,8, a skupini niskih ljudi
sa stupnjem 0,2. Jasno je da ove definicije granica nisu apsolutne i da ovise o kontekstu zadatka.
5 ZAKLJUČIVANJE I RASUĐIVANJE
172
Slika 5-17. Klasična (lijevo) i neizrazita (desno) definicija pojmova visoki nizak
U ovom primjeru imamo lingvističku varijablu VISINA koja ima svoje lingvističke vrijednosti
visoki nizak, ali ima i numeričke vrijednosti između 0,7 m i 3,0 m. Neizraziti skupovi prikazani na
slici 5-17 (desno) daju značenje lingvističkim vrijednostima visoki nizak na način da se svakoj realnoj
vrijednosti visine x pridružuje određena vrijednost pridružene funkcije. To se često formalno piše μ
A*
(x)
ili jednostavnije A* (x), primjerice VISOK(1,8) = 0,5 ili NIZAK(2,0) = 0,2.
U teorija neizrazitih skupova definirane su i različite operacije nad skupovima, od kojih su
osnovne unija, presjek i komplementa. One u jezičnoj formi odgovaraju veznicima I, ILI i negaciji NE, a
u neizrazitoj logici operatorima konjunkcije, disjunkcije i negacije. Pri tome se može koristiti bilo koji
način definiranja ovih logičkih operatora T i S normama, o kojima smo govorili u dijelu poglavlja 4.3.3
posvećenom neizrazitoj logici, ali u praksi se najčešće koristi min-max logika definirana tablicom 4-5 koja
za presjek koristi operaciju min, za uniju max, a za komplement operaciju minus:
A*(x)
q
B*(x) = max [A*(x); B*(x)]
(5-31)
A*(x)
<
B*(x) = min [A*(x); B*(x)]
(5-32)
¬
A*(x) = 1 A*(x)
(5-33)
Na primjer, vrijednost pridružene funkcije pojma ((VISINA 2 m JE VISOKA) i (VISINA 2 m JE
NISKA)) je min(0,8; 0,2) = 0,2.
Zadeh i ostali istraživači nakon njega pokazali su i dokazali da je ovakav način definiranja
operatora najbliži ljudskom intuitivnom shvaćanju tih pojmova u jezičnom obliku izraženih veznicima I,
ILI i negacijom NE.
Svi do sada spomenuti neizraziti skupovi bili su kontinuirani, što znači da im je skup na kojem
se definiraju bio kontinuum. Primjerice, pojmove veliki i mali definirali smo na intervalu realnih
brojeva koji su predstavljali visine ljudi izražene u metrima. Skup svih realnih brojeva
i
predstavljao je
naš svijet rasuđivanja Ω, a unutar njega je definiran interval H = [0,7 , 3]
r
Ω koji sadrži realne vrijednosti
visina ljudi. Skup H naziva se podrška (engl. Support) neizrazitih skupova veliki i mali. Podrška
neizrazitog skupa može biti i diskretan skup. U tom slučaju neizraziti skup ne definiramo krivuljom kao
na slici 5-17, već diskretnim vrijednostima pridružene funkcije. Pogledajmo primjer. Neka je skup Ω skup
svih ljudi i unutar njega izdvojimo podskup A koji čine samo tri čovjeka A = {PETAR, IVAN, LUKA} kao
što prikazuje slika 5-18. Definiramo li na skupu A neizraziti skup V* = VISOKI LJUDI, tada njegova
pridružena funkcija može na primjer glasiti V* = 0,6/PETAR + 1/IVAN + 0/LUKA gdje 0,6 predstavlja
vrijednost pridružene funkcije kojom se procjenjuje s kojim stupnjem pripadnosti Petar pripada skupu
visokih ljudi. Matematički to možemo označiti V*(PETAR) = 0,6.
5 ZAKLJUČIVANJE I RASUĐIVANJE
173
Slika 5-18. Primjer definiranja diskretnog neizrazitog skupa čiju podršku čini skup troje ljudi: Petar,
Ivan i Luka
U ovakvom načinu prikaza neizrazitog skupa + ne znači zbrajanje, već samo povezuje sve
elemente pridružene funkcije neizrazitog skupa V*. Umjesto takvog, dugog zapisa, češće se koristi kraći
zapis tzv. neizrazitim vektorom V* = [0,6; 1; 0]. Kod ovakvog zapisa treba se precizno znati redoslijed
elemenata podrške neizrazitog skupa A = {PETAR, IVAN, LUKA}. Kako bi se naglasila veza skupa
podrške A i neizrazitog skupa V*, piše se Support(V*) = A i čita: Podrška neizrazitog skupa V* je skup
A.
Formalna definicija neizrazitog skupa kaže da je on skup uređenih parova, od kojih je prvi
element podrške, a drugi njegova vrijednost pridružene funkcije. Za prethodni primjer to pišemo ovako:
V* = {(a ,V*(a))}, a
s$
P(V*) = A
(5-34)
gdje je a element podrške, a V*(a) njegova vrijednost pridružene funkcije. Neizraziti skup V* u punom
zapisu bi bio V* = {(PETAR, 0,6), (IVAN, 1), (LUKA, 0)}, ali se u praksi češće koristi neizraziti vektor kod
neizrazitih skupova diskretne podrške ili prikaz krivuljom kao na slici 5-17 kod neizrazitih skupova
kontinuirane podrške.
5.3.2 Lingvistička aproksimacija neizrazite relacije
Sljedeći važan pojam je pojam neizrazite relacije (engl. Fuzzy Relation). Pretpostavimo da
imamo dva dvočlana skupa ljudi: skup X = {IVAN, PETAR} i skup Y = {JOSIP, LUKA} i da želimo iskazati
sličnost između svakog čovjeka iz skupa X i iz skupa Y. Svojstvo sličnosti je teško mjerljiva kategorija,
ali lako procjenjiva. Pretpostavimo da je procjenitelju dozvoljeno da sličnost izražava koristeći skalu
brojeva od 0 do 1. Što su ljudi sličniji, to im stupanj sličnosti treba biti bliže jedinici. Procjenitelj je svoju
procjenu prikazao tablicom 5-6.
Tablica 5-12. Tablica s procjenom sličnosti skupa X = {IVAN, PETAR} i skupa Y = {JOSIP, LUKA}
JOSIP
LUKA
IVAN
0,8
0,6
PETAR
0,2
0,9
Stupanj sličnosti Josipa i Ivana je 0,8, a Luke i Ivana 0,6. Najsličniji su Luka i Petar, a najmanje
slični Josip i Petar. Tablica 5-6 nije ništa drugo nego pridružena funkcija neizrazite relacije koju smo
nazvali R* = SLIČNOST”. Neizrazita relacija je dvodimenzionalni neizraziti skup koji definiramo
izrazom:
R* = {((x,y), R*(x,y))}, (x,y)
s$
X x
Y
(5-31)
5 ZAKLJUČIVANJE I RASUĐIVANJE
174
Prvi dio uređenog para element je Kartezijevog skupa skupova X i Y, što drugim riječima znači
element skupa kojeg čine sve moguće kombinacije skupova X i Y. U našem primjeru to su X x Y = {(IVAN,
JOSIP), (IVAN, LUKA), (PETAR, JOSIP), (PETAR, LUKA)}. Drugi dio para su vrijednosti pridružene
funkcije, u našem primjeru prikazane tablicom 5-6.
Kraći način zapisa neizrazite relacije je neizrazita matrica:
t
8
u
E'F E'G
E'( E'I
v
ali se kod nje, kao kod neizrazitog vektora, treba znati redoslijed podrške. Definicijski izraz za R*
definira dvodimenzionalnu, binarnu neizrazitu relaciju, a općenito neizrazita relacija može biti i n-
dimenzionalna.
Jedna od najvažnijih neizrazitih relacija je neizrazita relacija implikacije. Ona je temelj
neizrazitih produkcijskih sustava. Jezični oblik neizrazite relacije implikacije je uzročno-posljedična
rečenica:
Ako je A* iz X, onda je B* iz Y.
Npr.: Ako je odstupanje SREDNJE POZITIVNO, onda je upravljanje MALO NEGATIVNO'.
ODSTUPANJE i UPRAVLJANJE su varijable, a SREDNJE POZITIVNO i MALO NEGATIVO
njihove vrijednosti definirane odgovarajućim neizrazitim skupovima. Pogledajmo kako se uz pomoć
neizrazitih pravila formira stručni (ekspertni) sustav temeljen na jezičnim pravilima i provodi neizrazito
zaključivanje i rasuđivanje.
Neizraziti stručni (ekspertni) sustav temeljen na jezičnim pravilima je, kao što mu samo ime kaže,
informacijski sustav koji omogućava korisniku dobivanje odgovarajućeg odgovora na pitanja iz određenog
stručnog područja. Odgovori se dobivaju korištenjem stručnog znanja pohranjenog u bazi znanja koja se
formira na temelju jezičnih pravila, te onda uz pomoć teorije lingvističke aproksimacije, temeljene na
teoriji neizrazitih skupova, prebacuje u formalni matematički oblik. Ovakvi sustavi imaju mogućnost
netrivijalnih odgovora i na pitanja koja nisu izravno pohranjena u bazi znanja, koristeći interpolaciju i
interpretaciju pohranjenog znanja.
Kako je baza znanja stručnog sustava spremište ljudskog znanja koje je u svom temelju
neprecizno, znanje je obično pohranjeno u obliku činjenica i pravila koja su često u obliku uzročno-
posljedičnih jezičnih izjave oblika:
Ako je UZROK, onda je POSLJEDICA.
„Ako je SITUACIJA, onda je AKCIJA.
Ako je PRETPOSTAVKA, onda je ZAKLJUČAK.
Već smo upoznali da se ovakav oblik iskazivanja znanja naziva produkcijsko pravilo. Teorija
neizrazitih skupova i neizrazita logika omogućile su ugradnju nepreciznosti, približnosti i realnosti u
produkcijska pravila. Na taj su ih način približile čovjeku i njegovom stvarnom načinu opisa pojedine
situacije ili akcije. Teorija neizrazitih skupova i neizrazita logika omogućile su da se produkcijska pravila
neprecizno iskazana prirodnim jezikom prikažu odgovarajućim formalnim prikazom, te na taj način
kodiraju za buduću računalnu primjenu. Jezične vrijednosti uzroka, posljedice, situacije i akcije
modeliraju se odgovarajućim neizrazitim skupovima i kasnije koriste u postupku zaključivanja i
rasuđivanja. Brojne su praktične primjene dokazale efikasnost i djelotvornost ovakvog pristupa.
5.3.3 Neizrazito zaključivanje
Osnovni dio neizrazitog stručnog sustava u kojem se provodi neizrazito zaključivanje čine jezična
pravila, s tim da se i u uzročnom i u posljedičnom dijelu pravila varijable mogu kombinirati korištenjem
veznika i (presjek neizrazitog skupa) i ili (unija neizrazitog skupa). Uzmimo za primjer automatsko
vođenje vozila ilustrirano slikom 5-19.
5 ZAKLJUČIVANJE I RASUĐIVANJE
175
Slika 5-19. Neizrazite vrijednosti ulazno-izlaznih veličina stručnog sustava za automatsko vođenje
vozila, te primjer neizrazitog zaključivanja
Slika prikazuje na koji se način matematički definiraju osnovne lingvističke varijable brzina,
ubrzanje, udaljenost i snaga motora. Ove varijable su povezane neizrazitim pravilima koja opisuju kako
regulirati snagu motora budu:
PRAVILO 1. Ako je brzina PREVIŠE MALA i ubrzanje USPORAVA, onda snagu motora
POVEĆAJ JAKO.
5 ZAKLJUČIVANJE I RASUĐIVANJE
176
PRAVILO 2. Ako je brzina MALA i ubrzanje USPORAVA, onda snagu motora POVEĆAJ MALO.
PRAVILO 3. Ako je udaljenost BLIZU, onda snagu motora SMANJI MALO.
Pravila je odredio stručnjak (ekspert) koji dobro zna kako voziti automobil.
Pretpostavimo da se vozilo upravo uspinje uz brdo, da mu je brzina mala, da usporava i da je blizu
vozila ispred sebe. Na Slici 5-19 označene su te sadašnje vrijednosti ulaznih veličina.
Pitanja su:
Kako na temelju neizrazitih pravila, definicije neizrazitih skupova, i sadašnjih stvarnih
vrijednosti, donijeti zaključak i odrediti izlaz (potrebnu snagu motora)?
Kako donijeti zaključak uzevši u obzir ova tri pravila?
Neizrazito zaključivanje i rasuđivanje temelji se na kompozicijskom pravilu utjecaja (engl.
Compositional Rule of Inference) koje se sastoji od tri koraka (slika 5-20):
1. određivanje stupanj zadovoljenja pravila
2. određivanje združenog neizrazitog skupa izlaza uzevši u obzir stupnjeve zadovoljenja
pravila i
3. interpretiranje rezultata jednom jedinstvenom vrijednošću podrške izlazne varijable.
Slika 5-20. Shematski prikaz postupka neizrazitog zaključivanja
5 ZAKLJUČIVANJE I RASUĐIVANJE
177
Proračunski dio kompozicijskog pravila utjecaja može se obaviti na više načina. Najjednostavnije
i najčešće korišteno je tzv. max-min kompozicijsko pravilo utjecaja koje se na našem primjeru
vođenja vozila sastoji u sljedećem:
Određivanje stupnja zadovoljenja pravila
Stupanj zadovoljenja pravila dobije se tako da se odredi vrijednost pridružene funkcije ulaznih
varijabli za stvarne vrijednosti ulaznih varijabli, uz to da se veznik i interpretira kao presjek upotrebom
operacije min:
u slučaju PRAVILA 1. to je:
PREVIŠE MALA (SADAŠNJA BRZINA) = 0,2
USPORAVA (SADAŠNJE UBRZANJE) = 1
STUPANJ ZADOVOLJENJA PRAVILA 1 = min (0,2; 1) = 0,2
za PRAVILO 2. vrijedi:
MALA (SADAŠNJA BRZINA) = 0,8
USPORAVA (SADAŠNJE UBRZANJE) = 1
STUPANJ ZADOVOLJENJA PRAVILA 2 = MIN (0,8; 1) = 0,8
za PRAVILO 3. vrijedi:
BLIZU (SADAŠNJA VRIJEDNOST) = 0,5
STUPANJ ZADOVOLJENJA PRAVILA 3 = 0,5
Očito je da će u postupku donošenja odluke najveći utjecaj imati PRAVILO 2, ali i da utjecaji
PRAVILA 3 i PRAVILA 1 neće biti zanemarivi.
Određivanje združenog neizrazitog skupa izlaza
Pojedini neizraziti skupovi izlaza formiraju se tako da se stupnjem zadovoljenja pravila ograniči
neizraziti skup izlaza tog pravila. Slika 5-19 to prikazuje zorno. Na primjer: PRAVILO 3 ima izlaz
SMANJI MALO. Njegov stupanj zadovoljenja je 0,5 pa iscrtkana površina prikazuje rezultat. Ovaj
način proračuna je u stvari modeliranje neizrazite relacije implikacije operacijom minimum. Združeni
neizraziti skup izlaza jednak je maksimumu svih pojedinih izlaza, što na Slici 5-19 prikazuje deblja linija
ispod koje je crtkana površina.
Interpretiranje rezultata jedinstvenom vrijednošću
Kako nas najčešće zanima stvarna vrijednost izlazne varijable, u ovom slučaju snage motora,
združeni neizraziti skup izlaza treba se prikazati jednom jedinom vrijednošću svoje podrške. Pri tome se
najčešće koristi metoda težišta kojom se računa težište iscrtkanog združenog neizrazitog skupa. Na Slici
5-19 težište je označeno strelicom. Površine iscrtkanih dijelova lijevo i desno od težišta su jednake. Jezična
interpretacija rezultata za naš primjer bi bila:
Povećaj malo snagu motora, zato što je vozilo ispred blizu, ali mi usporavamo zbog penjanja uz brdo.
ali nam to i nije važno. Važna nam je brojčana vrijednost snage motora.
Ovaj je postupak donošenja zaključaka detaljno prikazan na slici 5-20 jednostavan, ali vrlo
efikasan. Najteži dio je, kao i kod svih ostalih stručnih sustava: Kako doći do pravog znanja
produkcijskih pravila? Kako to znanje izvući iz stručnjaka uzevši u obzir što on u stvari misli kada kaže:
Brzina je previše mala.Ovim se poslom bave inženjeri znanja koji, osim tehničkog obrazovanja, imaju i
obrazovanje iz područja psihologije i sociologije.
Primjer jednog stvarnog pravila vođenja rotacione peći za proizvodnju cementa je:
Ako je temperatura zadnjeg dijela peći JAKO SMANJENA i postotak kisika MALI
i temperatura goruće zone peći MALA, onda brzinu peći SMANJI i dotok goriva SMANJI.
Pri vođenju peći koristi se tridesetak ovakvih pravila.
5 ZAKLJUČIVANJE I RASUĐIVANJE
178
Neizrazita logika je kao i svaka nova tehnologija od svog začetka 1965. godine do danas prolazila
i faze euforije i faze razočaranja. Svaka nova tehnologija počinje naivnom euforijom. Početni entuzijazam
često ljude potiče da očekuju više nego je moguće stvarno dobiti. Gotovo uvijek nagli rast očekivanja
izazove protureakciju, najviše zbog toga što tehnologija nije još sazrela pa se obećanja ne mogu ispuniti.
Velik broj ideja ovdje i završi i nikada više ne prođu prag pozitivnog očekivanja, bilo zbog toga što nisu
bile prave ideje, bilo zbog toga što se prestalo u njih ulagati. One ideje koje prežive, prežive najviše zbog
toga što je netko pronašao pravu korisnu primjenu. Iza toga slijedi novi poticaj razvoja i nove korisne
primjene.
U razvoj neizrazite tehnologije uloženo je puno, što možda najbolje ilustrira podatak da je
japansko ministarstvo trgovine (MITI) praćeno velikim proizvođačima, još 1988. godine uložilo u
sedmogodišnji program komercijalne primjene neizrazite logike 150 milijuna američkih dolara. Središnji
dio istraživanja odvijao se u novoosnovanom laboratoriju LIFE (engl. Laboratory of Industrial Fuzzy
Engineering). Rezultati takvog ulaganja očituju se među ostalim i u tisućama patenata koje Japanci
danas drže, a primjenjuju se od perilica za robu do podzemne željeznice. Dva tipična primjera uspješne
primjene neizrazite logike su:
Vođenje rotacione peći za proizvodnju cementa sustav je u primjeni od 1982. godine i
rezultirao je prosječnim smanjenjem potrošnje goriva za 2,5%, povećanjem čvrstoće cementa
za 2,5% i produženjem vremena između dva remonta peći za 4 mjeseca.
Predviđanje stanja na burzi namjenski rađeno za Yamachi Trading System. Sastoji se od
800 neizrazitih pravila i prati dionice 65 industrija. Sustav je predvidio katastrofu na burzi
(engl. Black Monday) osam dana prije.
A sve je započelo 1965. godine u glavi profesora Lotfija A. Zadeha. Njegov seminalni rad iz
1965. godine Fuzzy Sets (Zadeh, 1965) je najcitiraniji članak svih znanosti i svih vremena. Teorija
neizrazitih skupova i neizrazita logika utjecale su na brojna područja ljudskog života što je dobro naglasio
Zadehov učenik Bart Kosko u knjizi Fuzzy Thinking: The New Science of Fuzzy Logic (Kosko, 1993).
Kako bi se istaklo značenje Zadehove teorije, poznata udruga inženjera IEEE (Institute of Electrical and
Electronic Engineers) dodijelila je Zadehu 1995. godine nagradu za životno djelo (IEEE Medal of Honor).
................................................
Dodatak: Posljednjih 10-ak godina duboko učenje (engl. Deep Learning) temeljeno na dubokim
neuronskim mrežama, o kojem više govorimo u poglavlju 6.3.8., uspjelo je riješiti brojne probleme koje
standardni postupci simboličke ili dobre stare umjetne inteligencije nisu uspjeli riješiti. Duboko učenje je
posebno uspješno u zadacima prepoznavanja osjetilnih informacija (prepoznavanja objekata na slici,
prepoznavanja teksta i slično). Iako se duboko učenje, usudili bismo se kazati ponekad i pomodno, nastoji
samostalno upotrijebiti u rješavanju brojnih zadataka, posljednjih nekoliko godina velika se pažnja
posvećuje integraciji dubokog učenja i dobro poznatih postupaka simboličke umjetne inteligencije.
Rezultat ove fuzije je neurosimbolička umjetna inteligencija (engl. Neurosymbolic AI) ili hibridna
umjetna inteligencija (engl. Hybrid AI) koja uspješno kombinira obje tehnologije. Slika ispod
86
shematski prikazuje način djelovanja simboličke umjetne inteligencije i dubokog učenja, te primjer
njihovog združivanja u hibridnu umjetnu inteligenciju. Zadatak koji je ova mreža uspješno riješila je
kompleksni zadatak vizualnog zaključivanja (engl. Visual Reasoning). 2016.g. istraživači sa Stanford
University i Facbook AI Reserach objavili su rad vezan s vizualnim zaključivanjem o 3-D objektima
na slici
87
. U CLEVR (Compositional Language and Elementary Visual Reasoning ) bazi objavljeno je više
od 100.000 računalno generiranih slika različitih objekata. Zadatak je bio napisati program koji bi
uspješno izabirao slike na temelju verbalnih upita tipa: Postoji jednak broj velikih stvari i metalnih
kugli? ili još složenije: Postoji kugla iste veličine kao metalna kocka; napravljen od istog materijala kao
i mala crvena kugla?.
86
Slika je prilagođena prema https://knowablemagazine.org/article/technology/2020/what-is-neurosymbolic-ai
87
Slike i primjeri su iz rada J.Johnson et al., CLEVR: A Diagnostic Dataset for Compositional Language and
Elementary Visual Reasoning -!https://arxiv.org/pdf/1612.06890.pdf!!
5 ZAKLJUČIVANJE I RASUĐIVANJE
179
"
"
Hibridni sustav umjetne inteligencije koristio je umjetnu
neuronsku mrežu za prepoznavanje objekata na slici i
formiranje baze znanja o njima, dok je simbolička ili dobra
stara umjetna inteligencija, koristeći standardne postupke
zaključivanja i formiranu bazu znanja, davala odgovore na
postavljena pitanja. Mreža je bila uspješna u 92,6% slučajeva,
pa je slična struktura kasnije korištena u rješavanju još
složenijih zadataka kod kojih ulazni podatak nije bila slike
nego video. Ova bi tehnologija mogla biti vrlo važna za
autonomna vozila čije vrijeme dolazi.
Na slici lijevo
87
je primjer jedne od slika i lingvistički način
definiranja različitih pojmova kojima se opisuju elementi slike,
na primjer:
„Velika siva metalna kugla” (engl. Large gray metal sphere)
ili
Mali metalni plavi valjak (engl. Small blue metal cilinder)
ili
pojmovi „lijevo“ (engl. Left) i „desno“ (engl. Right).