Post

Koneoppi 1

Koneoppiminen

Symbolinen tiedonkäsittely ja konnektionistinen tiedonkäsittelymalli kehittyivät vaiheittain konsepteina pitkään 1900-luvun puolenvälin aikaan.

  • Symbolinen tiedonkäsittely: Tärkeimpänä erona voisi ajatella symbolisen tiedonkäsittelyn laskevan ja prosessoivan informaatiota sisääntulevan informaation loogisista suhteista toisiinsa symbolisella tavalla. Informaatiokokonaisuus yhdistetään tai jaetaan rakenteellisiin yksiköihin funktiolle, joka tulkitsee ja laskee eksplisiittisesti yksittäisen tai yhdistetyn yksikön symbolisesti antaen deduktiivisesti yhden taikka haluttaessa useamman moniulotteisen ulostulevan symbolin.

  • Turingin malli: Mallin toimintatapa kuvastaa vahvasti Turingin tietoa käsittelevän koneen mallia, jossa operaatioissa laskettavat yksikköarvot ovat rakenteellisella tasolla ennalta määrättyjä ja itse laskutapa on perimmiltään sääntöpohjainen algoritmi.

  • Yhteenveto: Lyhyesti sanottuna, symbolinen informaatiokäsittely on sääntöpohjainen ennalta määrätyillä yksiköillä toimiva funktionaalinen input-output menetelmä, joka ei omaa itseoppivia ominaisuuksia.

Malli on hyvin laajasti käytössä järjestelmissä, jossa on rajallinen määrä datan tyyppejä, josta voidaan rakentaa looginen päättelyjärjestelmä esimerkiksi pakettidatan logistiseen manipulaatioon.

Dataohjatulla Konnektionistisella Neuroverkkomallilla

Dataohjatulla konnektionistisella neuroverkkomallilla kuvataan aloituspisteeltään ja rakenteelliselta toimintamallilta hyvin erilaista systeemiä. Mallilla jäljennetään biologisten neuronien tapaa toimia keskenään verkossa, tai tarkemmin sanottuna, neuroverkossa.

Painoarvojen Dynaaminen Säätely

Neuroverkko omaisi alkujaan määrittämättömät taikka satunnaisesti asetetut painoarvot. Verkosto säätelee näitä suhteessa:

  • Lopputuloksen todenperäisyyteen
  • Tavoiteltuun arvoon

Neuroverkko on nimenomaan verkosto, eli nämä “neuronit” ovat vuorovaikutuksessa toistensa kanssa. Säätelyssä painoarvot dynaamisesti muuttuvat kunnes yhteyksien väliset painoarvot vaiheittain “osaavat” sovittaa syötteet haluttuihin tuloksiin.

Takaisinpropagointialgorytmi ja Itseoppiminen

Malli yleisesti hyödyntää itseoppimisessa takaisinpropagointialgorytmiä, joka mahdollistaa verkon painoarvojen tavoitteellisen manipulaation iteratiivisesti. Tämä muodostaa positiivisen palautesilmukan kohti todennäköisempää ja optimoidumpaa algorytmiä.

Turingin testi

Alan Turingin kehittämä testi, jossa menetelmällisesti pyritään arvioimaan koneen kykyä suorittaa ihmismäisesti älyllisiä toimintoja ja niiden verrannollisuutta ihmismäiseen älyyn tuottamaan muodolliseen ja laadulliseen kuvaan.

Testin menetelmä perustui tekstipohjaiseen keskusteluun, jossa osallistuvan ihmisen pitää luotettavasti arvioida onko keskustelukumppaninsa tuottama tekstuaalinen aineisto ihmisen vai koneen tuottamaa, tietämättä tätä etukäteen. Tosin tulee ottaa huomioon, että testi ei mittaa koneen ymmärrystä, ajattelua tai muita ihmiselle luontaisia kognetiivisia piirteitä, vaan pelkästään koneen kykyä emuloida ihmismäistä käyttäytymistä sekä verbaalisia taitoja ja kyvykkyyttä tekstipohjaisessa ympäristössä.

Eri tasoisia tekoälyjä

Tekoälyt voidaan kategorisoida karkeasti kolmeen eri luokkaan:

  1. Heikko tekoäly
  2. Vahva tekoäly
  3. Supertekoäly

Heikko tekoäly

Informaatiota käsittelevä konemainen looginen systeemi, jolla ei ole laajaa kontekstuaalista menettelytapaa toimia ympäristössään. Rajoitettu pitkälti toimimaan singulaarissessa ympäristössä tekemään yhtä tai useampaa haluttua lopputulosta. Näistä esimerkkejä datansiirron ”älykkäät” algoritmit, laskennallisten muuttujien dynaaminen laskeminen ja manipulointi, sekä datan deduktiivinen prosessointi ja derivointi.

Vahva tekoäly

Informaatiota käsittelevä ja tuottava “jonkin tasoinen tietoisuus,” joka osaa hyödyntää ja soveltaa ympäristönsä kontekstuaalista taustatietoa ja ilmeisimmin esillä olevien kohteiden tarkoitusta ja relevanssia. Suurilta osin vielä vain teoreettinen konsepti.

Sidenotes: Tietoinen ja tietoisuus täysin eri asioita samalla tavalla kuin havainnointi ja ymmärrys.

Supertekoäly

Hype-termi, vääristetty kuva ja oikeasti vain monimutkaisempi versio vahvasta tekoälystä. Kirjan kirjoittajalla on hyvä ymmärrys tekoälystä sekä sen teoreettisesta, kuin käytännön toiminnasta. Varsinkin kappaleessa 8 - Tekoälyn jatkokehityksen lähtökohtia, jossa käsitellään tekoälyille ominaisia piirteitä konseptina, sekä niiden rajoitteista viitaten esimerkiksi kirjailijaan Hubert Dreyfus sekä ilmeisimmin tämän kirjaan “What Computers Still Can’t Do”.

K-means algoritmi

Datan klusterointia iteratiivisesti tavoitteena “järjestää” vahvaa relevanssiyhteyttä omaava data klusterimaisesti “lähelle” toisiaan.

Algorytmi käyttää laskennallisia tapoja derivoidakseen impeerisiä yhteyksiä syötetyn datan ominaispiirteistä. Prosessin painoarvot algorytmissä muuttuu lopputuloksen optimointitrendin mukaan, ilman ulkoista ohjausta.

  • Opetusdata ja Testidata: Jaottelu opetus- ja testidataan on tärkeää mallin lopullisen ulostulon yli- ja alimitoituksen mitigointiin.

  • Optimointi: Generalisoimalla opetusdata “kuvaannollisesti” pienemmällä resoluutiolla, ja mahdollisesti myös kirjainmellisesti pienemmällä resoluutiolla, saadaan malli, joka optimoi algoritmiään yleiskuvannollisesti tärkeillä piirteillä ja suhteilla.

Algorytmi ei siis ylisovita yrittäen etsiä liian abstraktisti kasattuja malliklustereita vaikkapa pikselitarkasti edustettua kuvaa kissasta sitten testidatassa, joka arvioi edellämainitun opetusdatasta tehtyjen parametrisäätöjen luotettavuutta uudella setillä dataa; (Testidata).

Alisovittamisessa taasen kuvat ovat abstraktisesti liian yleistäviä, jotta niistä voitaisiin derivoida tulkinnallisesti todenperäisiä rakenteita. Näin voi tapahtua esimerkiksi kuville, joiden välillä on liian monta moniulotteisesti abstraktia erottavia tekijöitä. Tällöin testidataa ajaessa algorytmin ulostulo alkaa näyttämään lähinnä nopanheitolta, koska mitään selkeää rakenteellista erottelutapaa sillä ei ole.

This post is licensed under CC BY 4.0 by the author.