“Machine learning is the new statistics”

Meetup om statistical modelling, AI, big data, data mining, deep learning, machine learning, business intelligence, analytics, data driven og robotics med Martin Haulrich affødte dette referat/blogindlæg:

BI

Business Intelligence er “Data Driven”.
Hvilke data har business adgang til? Hvor? Må data bruges (privacy issues)? Hvilke analyser er mulige ud fra data?

Data mining

Analyser af data fra verden bygger på forudbestemte antagelser om verden, forskellige modeller af verden.

Simple modeller

Statistisk undersøger verden for at forstå den, statistik inkluderer spørgsmål som “hvorfor” og leder efter årsagssammenhænge (kausalitet). Det er et menneske med dømmekraft, der beslutter hvilken model, der skal bruges i hvilken sammenhæng.

Machine learning

Machine learning er at lade en beregner (computer) lave en model af verden baseret på data. Her findes sammenhænge (korrelationer). Det er fantatisk til forudsigelser og er baseret på:
– før: hvis/så (if/then) algoritmen, nu: vægtede funktioner (features)
– beslutningstræer,
– Long short-term memory (neurale netværk)
– og alle de andre algoritmer
Machine learning er udelukkende beregninger af korrelation og ikke kausalitet!

Deep learning

Machine learning OG statistik tilsammen åbner op for deep learning (representation learning) og kombinerer flere machine learning modeller i et lag-på-lag-af-algoritmer-design (“Forrest”)

Wikipedia has much more about machine learning

Udfordringer for machine learning og kunstig intelligens:

“Machine learning” er en underkategori til kunstig intelligens
“NetFlix-challenge”: lav træfsikre anbefalinger
“Birds nest”: Fugle kan lave holdbare, isolerede reder til deres æg af strå på kviste uden en PhD i matematik, fysik og design. Hvordan lærer de det?
“Deep Learning” er fabelagtigt til korrelation, men mangler al kausalitet, dvs årsagssammenhæng og dermed det menneskelige

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *

This site uses Akismet to reduce spam. Learn how your comment data is processed.