{"id":81828,"date":"2017-06-02T04:00:00","date_gmt":"2017-06-02T08:00:00","guid":{"rendered":"https:\/\/www.applause.com\/blog\/sprache-kuenstliche-intelligenz-evolution\/"},"modified":"2025-07-21T11:18:14","modified_gmt":"2025-07-21T15:18:14","slug":"sprache-kuenstliche-intelligenz-evolution","status":"publish","type":"post","link":"https:\/\/www.applause.com\/de\/blog\/sprache-kuenstliche-intelligenz-evolution\/","title":{"rendered":"Wie Sprache zu der Revolution der k\u00fcnstlichen Intelligenz (AI) f\u00fchrte"},"content":{"rendered":"<div class=\"et_pb_section_0 et_pb_section et_section_regular et_flex_section preset--module--divi-section--31615dad-3f88-477f-a866-c2b40c889be5\"><div class=\"et_pb_row_0 et_pb_row et_flex_row\"><div class=\"et_pb_column_0 et_pb_column et-last-child et_flex_column et_pb_css_mix_blend_mode_passthrough et_flex_column_24_24 et_flex_column_24_24_tablet et_flex_column_24_24_phone et_flex_column_24_24_phoneWide et_flex_column_24_24_tabletWide et_flex_column_24_24_widescreen et_flex_column_24_24_ultraWide\"><div class=\"et_pb_text_0 et_pb_text et_pb_bg_layout_light et_pb_module et_flex_module preset--group--divi-text--divi-font-body--default preset--group--divi-text--divi-font-body--h19rs5u--default preset--group--divi-text--divi-font-body--h1yjkjr--default preset--module--divi-text--4564d33f-bb24-4931-8445-a739e42249ca\"><div class=\"et_pb_text_inner\"><h1>Wie Sprache zu der Revolution der k\u00fcnstlichen Intelligenz (AI) f\u00fchrte<\/h1>\n<p>Sprache ist und wird das wichtigste Werkzeug f\u00fcr den Fortschritt der k\u00fcnstlichen Intelligenz sein. Im Jahr 2017 treiben Maschinen, die nat\u00fcrliche Sprache verstehen (Natural Language Understanding Engines, NLU) den Fortschritt von Bots und sprachaktivierten pers\u00f6nlichen Assistenten wie Cortana von Microsoft, Assistant von Google, Alexa von Amazon und Siri von Apple voran. Sprache war der Ausgangspunkt und der Ort aller neuen F\u00e4higkeiten maschinellen Lernens, die in den vergangenen Jahren entwickelt wurden.<\/p>\n<p>Aus Sprache \u2014 sowohl geschrieben als auch gesprochen \u2014 entstand eine neue \u00c4ra der Interaktion von Mensch und Computer. Als Menschen Schwierigkeiten hatten, sich vorzustellen, was m\u00f6glicherweise nach Smartphone-Apps als H\u00f6hepunkt der Nutzererfahrung kommen k\u00f6nnte, entwickelten Forscher die Tools f\u00fcr eine v\u00f6llig neue Generation von Schnittstellen auf Basis der Sprache.<\/p>\n<p>\u201eWir denken, dass mit der Zeit alles, was an Software entwickelt wird, Sprache lernen wird\u201c, so Lili Cheng, Gesch\u00e4ftsf\u00fchrerin der Future Social Experiences (FUSE) Labs von Microsoft in einem Briefing mit Reportern in Seattle vor der Microsoft Build 2017. \u201eIch denke, dass sich im Laufe des Jahres in Bezug auf intelligente Gespr\u00e4chsf\u00fchrung und Bots sehr viel getan hat.\u201c<\/p>\n<h3><strong>Der kommerzielle Durchbruch von neuronalen Netzwerken<\/strong><\/h3>\n<p>Einer der Gr\u00fcnde, warum Peter Lee, Corporate Vice President von Microsoft Research und sein Team sich auf Sprache konzentrieren, wenn sie maschinelles Lernen entwickeln, war, dass dies zu verschiedenen Forschungsbereichen in der k\u00fcnstlichen Intelligenz passt. Sprache k\u00f6nnte f\u00fcr Forscher als eine Art und Weise funktionieren, theoretische Freifeld-Versuche durchzuf\u00fchren, ohne Intention f\u00fcr eine andere praktische Anwendung als Wissen um des Wissens willen zu erschaffen. Wie wir seither beobachten konnten, bot Sprache auch die M\u00f6glichkeit f\u00fcr bestimmte kommerzielle Anwendungen.<\/p>\n<p><a role=\"link\" href=\"https:\/\/readwrite.com\/2013\/10\/23\/researchers-create-the-building-blocks-of-the-future\/\" target=\"_blank\" rel=\"noreferrer noopener\">Lee sagte zu dieser Zeit:<\/a><\/p>\n<blockquote>\n<p>Einmal lebten die Hoffnung und der Optimismus wieder auf, sie leben f\u00fcr uns wieder auf, dass es m\u00f6glich sein wird, einige der am l\u00e4ngsten bestehenden Probleme im Kernbereich der k\u00fcnstlichen Intelligenz zu l\u00f6sen. N\u00e4mlich Maschinen dazu zu bringen, dass sie auf einem Niveau sehen und h\u00f6ren k\u00f6nnen und Argumente verstehen k\u00f6nnen, die menschliche F\u00e4higkeiten verstehen und ihnen gleichkommen.<\/p>\n<\/blockquote>\n<blockquote>\n<p>Ich denke, dass wir Ersteres beobachten k\u00f6nnen, wenn wir uns mit Sprache besch\u00e4ftigen. Ich denke, dass Sprache an erster Stelle kommt, da es ein etwas simpleres Problem ist, aber eines, das kommerzielle Auswirkungen hat. Es geht also sehr schnell voran.<\/p>\n<\/blockquote>\n<blockquote>\n<p>In Bezug auf Computer wird diese Idee angewendet, um Muster und Signale an Dingen zu finden, die jeden Tag getragen werden. Durch das Beobachten aller Instrumentierungen und den Logs der Fabriken. Durch das Beobachten der elektronischen Patientenakten, mit denen Krankenh\u00e4user arbeiten. Diese Anwendungen sind in Bezug auf Deep Learning (tiefes Lernen) sehr beeindruckend.<\/p>\n<\/blockquote>\n<p>Der Fokus auf Sprache hat uns einen ersten kommerziellen Vorgeschmack auf k\u00fcnstliche Intelligenz in der wirklichen Welt verschafft. Im Jahr 2011 f\u00fcgte Microsoft zu Skype eine \u00dcbersetzungsfunktion hinzu. Virtuelle Assistenten wie Cortana, Siri, Google Assistant und Alexa schaffen neue Wege f\u00fcr die Interaktion von Mensch und Computer.<\/p>\n<p>Und noch wichtiger, der Fokus auf Sprache (und Bilder) hat zu der Entwicklung neuronaler Netzwerke gef\u00fchrt, den Motoren hinter der Maschine und tiefem Lernen und zugleich Vorboten der k\u00fcnstlichen Intelligenz.<\/p>\n<h3><strong>Wo neuronale Netze herkommen und wohin sie sich entwickeln<\/strong><\/h3>\n<p>Das Konzept der neuronalen Netzwerke ist nicht neu.<\/p>\n<p>Die Vorstellung davon existiert bereits seit mehr als 70 Jahren. Einige der ersten Versuche, Computer zu bauen, orientierten sich an dem Vorbild des menschlichen Gehirns. Aber Logik-Engines haben sich als viel effizienter erwiesen und schaffen den bin\u00e4ren Maschinencode, der heute in jeder Software Anwendung findet. Die Vorstellung von neuronalen Netzwerken tauchte in den 1980ern wieder auf, als Forschern mit Entscheidungsalgorithmen, die sich von den String-Logik-Engines abwendeten, ein Durchbruch gelang. Das Konzept der k\u00fcnstlichen Intelligenz und die Forschung in diesem Bereich waren bis in die fr\u00fchen 1990er Jahre angesagt, bis die Defense Advanced Research Projects Agency (DARPA), eine Beh\u00f6rde des Verteidigungsministeriums der Vereinigten Staaten, die F\u00f6rderung von Forschung im Bereich AI einstellte und die Forscher erkannten, dass die schiere Menge an Rechenleistung, um das Konzept zu verwirklichen, einfach noch nicht existierte.<\/p>\n<p>Dieser Zeitraum wird auch als der\u00a0<a role=\"link\" href=\"https:\/\/en.wikipedia.org\/wiki\/AI_winter#The_setbacks_of_the_late_1980s_and_early_1990s\" target=\"_blank\" rel=\"noreferrer noopener\">\u201eWinter der k\u00fcnstlichen Intelligenz\u201c<\/a>\u00a0bezeichnet.<\/p>\n<p>\u201eSpracherkennung war einer unserer ersten Forschungsbereiche. Wir verf\u00fcgen \u00fcber mehr als 25 Jahre Erfahrung in diesem Bereich. In den fr\u00fchen 90er Jahren hat es tats\u00e4chlich nicht funktioniert\u201c, so Rico Malvar, anerkannter Techniker und Chefwissenschaftler f\u00fcr Microsoft Research in einem Briefing auf dem Microsoft Campus in Redmond. \u201eDann kam die Jahrtausendwende und wir kamen auf einige sehr interessante Ergebnisse. Wir erhielten erstmals Fehlerquoten unter 30%. Von 2000 bis knapp vor 2010 konnten wir kaum Fortschritte erzielen.\u201c<\/p>\n<div class=\"blog-image-single\">\u00a0<\/div>\n<p>2009 wird in der Community der k\u00fcnstlichen Intelligenz als Jahr gesehen, in dem bei Deep Learning Netzwerken tats\u00e4chlich echte Fortschritte erzielt werden konnten. Li Deng von Microsoft wendete Anwendungen f\u00fcr tiefes Lernen auf Sprache an und war erstaunt \u00fcber die Ergebnisse. Fei Fei Li von Stanford (und nun Chefwissenschaftler bei Google) er\u00f6ffnete ImageNet, ein Deep Learning-Netzwerk mit Bilderkennung.<\/p>\n<p>Ab 2012 bis 2013 bildeten sich Deep Learning-Netzwerke als die Zukunft der k\u00fcnstlichen Intelligenz heraus. Microsoft konnte einen bahnbrechenden Durchbruch bei dem Verst\u00e4ndnis nat\u00fcrlicher Sprache erringen. Google begann damit, jedes Unternehmen im Bereich k\u00fcnstliche Intelligenz und Robotik zu kaufen, das das Unternehmen finden konnte. Zu dieser Zeit begann Facebook damit, die massiven Datensets auf Probleme der k\u00fcnstlichen Intelligenz anzuwenden. 2014 wechselte der Leiter des Google Brain Projektes, Andrew Ng, zur chinesischen Suchmaschine Baidu.<\/p>\n<h3><strong>Power plus Software: Die Reife neuronaler Netzwerke<\/strong><\/h3>\n<p>Die Faktoren, die Deep Learning-Netzwerke erm\u00f6glichten, stehen mit dem Aufstieg der Rechnerst\u00e4rke insgesamt in Verbindung. Die Ankunft und die Reife des Internets erforderte, dass die Berechnungsst\u00e4rke massiv steigen musste. Au\u00dferhalb der Verbraucherelektronik bedeutete dies eine Expansion der Rechenzentren, um die Berechnung und das Speichern dieser massiven Datenmengen zu erm\u00f6glichen. Ein Gro\u00dfteil dieser Daten wird als Text und Bilder gespeichert. Das sind zuf\u00e4llig genau die Zutaten, die f\u00fcr das Training von neuronalen Netzen ben\u00f6tigt werden. Technikunternehmen begannen damit, gro\u00dfe Rechenzentren zu bauen (was heute als die \u201eCloud\u201c bezeichnet wird) und haben damit mehr potenzielle Rechenkapazit\u00e4t geschaffen als der gegenw\u00e4rtigen Nachfrage entsprechend notwendig w\u00e4re.<\/p>\n<p>Es kam zu einer offensichtlichen Partnerschaft.<\/p>\n<p>\u201eDie Leute mit den tiefen neuronalen Netzwerken kommen und erfinden Dinge. Dann kommen die Sprachspezialisten und fragen \u201ak\u00f6nnen wir das verwenden\u2018\u201c, so Malvar. \u201e\u201aDas wird aber zehnmal so viel Rechenkapazit\u00e4t ben\u00f6tigen\u2018 \u2026 naja, wir haben eigentlich zehnmal mehr Kapazit\u00e4t.\u201c<\/p>\n<p>Die Genauigkeit f\u00fcr Sprach-, Text-, und Bilderkennung wurde sehr viel besser. Sowohl Google als auch Microsoft br\u00fcsten sich mit einer Genauigkeit von 4,9% und 5,9%, was dem Niveau der menschlichen F\u00e4higkeit entspricht.<\/p>\n<div class=\"blog-image-single\">\u00a0<\/div>\n<p>Die Verbindung von neuronalen Netzwerken mit den enormen Rechenkapazit\u00e4ten der Cloud kann zu erstaunlichen Ergebnissen f\u00fchren. Microsoft hat beispielsweise die Rechenkapazit\u00e4t seiner Cloud Azure erweitert, indem \u201eField Programmable Gate Arrays\u201c, sogenannte FPGAs, hinzugef\u00fcgt wurden. Dabei handelt es sich im Grunde um leistungsf\u00e4hige Chips f\u00fcr das maschinelle Lernen, die direkt in den Servern integriert sind. Gegenw\u00e4rtig ist die Verbindung von Cloud und neuronaler Netzwerke bei Microsoft so stark, dass die gesamte Enzyklop\u00e4die Wikipedia in einer Zehntelsekunde von Englisch in Spanisch \u00fcbersetzt werden kann.<\/p>\n<p>Das ist die unmittelbare Zukunft f\u00fcr Deep Learning Netzwerke und Netzwerke f\u00fcr maschinelles Lernen. Rahmenwerke wie TensorFlow von Google, CNTK von Microsoft, Caffe2 von Facebook oder Torch und Theano werden immer ausgefeilter, da rekurrente neuronale Netze und Convolutional Neural Networks reifen. Die Cloud wird mit neuen Rechenzentren weiter wachsen und immer gr\u00f6\u00dfere Datenmengen verarbeiten k\u00f6nnen, dem Moorschen Gesetz entsprechend wird Beschleunigungs-Hardware wie GPUs, FPGAs und die Tensor Procession Unit (TPU) von Google entwickelt.<\/p>\n<h3><strong>Praktische Anwendung: Auf einem Computer in deiner N\u00e4he<\/strong><\/h3>\n<p>Stelle dir vor, du w\u00e4rst beim Zahnarzt. Das erste, was ein Zahnarzt macht, wenn ein Patient hereinkommt, ist ein R\u00f6ntgenbild der Z\u00e4hne, um Karies erkennen zu k\u00f6nnen. Wenn ein Zahnarzt entsprechend typisch amerikanischer Arbeitszeiten arbeitet, wird er ca. 224 Tage im Jahr arbeiten. Wenn er t\u00e4glich sechs Patienten behandelt und bei allen ein R\u00f6ntgen durchf\u00fchrt, wird er ca. 1.342 R\u00f6ntgenbilder im Jahr betrachten. Im Laufe von 20 Jahren sind das 26.850 R\u00f6ntgenbilder von Z\u00e4hnen.<\/p>\n<p>Zwanzig Jahre und 26.850 R\u00f6ntgenbilder bilden die Summe des Wissens eines Menschenlebens, die meiste Erfahrung, die ein Zahnarzt haben kann. Es gibt 1,8 Millionen Zahn\u00e4rzte auf der Welt. Wenn jeder von ihnen die typische Anzahl von R\u00f6ntgenbildern ansieht, sind das 48,33 Milliarden Bilder in 20 Jahren.<\/p>\n<p>Und die heutigen neuronalen Netzwerke w\u00fcrden Stunden brauchen, um all diese 48,33 Milliarden Bilder einzuspeisen und k\u00f6nnten sie in Sekunden verarbeiten.<\/p>\n<p>Das Gesundheitswesen ist eine der offensichtlichen Branchen f\u00fcr die Fortschritte bei maschinellem Lernen. Die Arbeit eines Arztes beruht oft auf Bildern wie MRI, R\u00f6ntgenbildern, CT-Aufnahmen etc. Ein Arzt hat nur begrenzte Kapazit\u00e4ten. Neuronale Netzwerke hingegen k\u00f6nnen so geschult werden, dass sie Bilder erkennen, Muster formen und analytische Schl\u00fcsse ziehen k\u00f6nnen, die die Gesamtheit des menschlichen Wissens zur Basis haben. Neuronale Netzwerke k\u00f6nnen die Routine- und Ratearbeit erledigen und die Arbeit von Menschen einfacher und effizienter machen.<\/p>\n<p>Seit Beginn der Menschheitsgeschichte ist das die Grundaufgabe von Technik: die Arbeit von Menschen effizienter zu machen. Ist es beschwerlich, ein Feld mit der Hand zu beackern? Wie w\u00e4re es mit einem Pflug? Ist es schwer, all diese Steine vom Steinbruch in die Stadt zu schleppen? Versuche es doch mit R\u00e4dern. Das Pferd ist bockig und langsam? Diese Dampfmaschine schafft Abhilfe. Logische Berechnungen mit der Hand sind schwierig? Ich h\u00e4tte da einen Computer.<\/p>\n<div class=\"blog-image-single\">\u00a0<\/div>\n<p>Die Datenmenge kann nicht mehr manuell organisiert und verstanden werden? Starten wir das neuronale Netzwerk. Die Antwort auf die Anh\u00e4ufung, das Verst\u00e4ndnis, die Analyse und die Prognose aller menschlichen Daten, allen Wissens und allen Verhaltens wird die Reife neuronaler Netzwerke sein.<\/p>\n<p>Es ist schwierig, sich des gesamten Umfangs von maschinellem Lernen bewusst zu werden. Denke nur daran, dass fast das gesamte menschliche Verhalten gegenw\u00e4rtig mittels Smartphones, dem Internet, Kameras und Sensoren verfolgt, gez\u00e4hlt und digitalisiert werden kann. Wohin du gehst, wie du dorthin gelangst, was du isst, wie du Geld ausgibst, wie unsere Branche funktioniert, all die Daten aus deiner Umgebung\u2026alles. Die Maschinen der Technologiebranche werden ihre neuronalen Netzwerke bald einsetzen.<\/p>\n<\/div><\/div><\/div><\/div><\/div>","protected":false},"excerpt":{"rendered":"<p>\u201eNun, wir haben etwa 10 Mal mehr Rechenleistung\u2026\u201c<\/p>\n","protected":false},"author":42,"featured_media":75215,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"inline_featured_image":false,"footnotes":""},"categories":[282],"tags":[920,919],"resource-industry":[],"resource-solution":[],"resources\/types":[1244],"class_list":["post-81828","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-unkategorisiert","tag-artificial-intelligence","tag-voice","resource-type-blogs-de"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.applause.com\/de\/wp-json\/wp\/v2\/posts\/81828","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.applause.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.applause.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.applause.com\/de\/wp-json\/wp\/v2\/users\/42"}],"replies":[{"embeddable":true,"href":"https:\/\/www.applause.com\/de\/wp-json\/wp\/v2\/comments?post=81828"}],"version-history":[{"count":0,"href":"https:\/\/www.applause.com\/de\/wp-json\/wp\/v2\/posts\/81828\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.applause.com\/de\/wp-json\/wp\/v2\/media\/75215"}],"wp:attachment":[{"href":"https:\/\/www.applause.com\/de\/wp-json\/wp\/v2\/media?parent=81828"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.applause.com\/de\/wp-json\/wp\/v2\/categories?post=81828"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.applause.com\/de\/wp-json\/wp\/v2\/tags?post=81828"},{"taxonomy":"resource-industry","embeddable":true,"href":"https:\/\/www.applause.com\/de\/wp-json\/wp\/v2\/resource-industry?post=81828"},{"taxonomy":"resource-solution","embeddable":true,"href":"https:\/\/www.applause.com\/de\/wp-json\/wp\/v2\/resource-solution?post=81828"},{"taxonomy":"resource-type","embeddable":true,"href":"https:\/\/www.applause.com\/de\/wp-json\/wp\/v2\/resources\/types?post=81828"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}