{"id":5280,"date":"2024-08-30T20:15:02","date_gmt":"2024-08-30T18:15:02","guid":{"rendered":"https:\/\/www.ollmetzer.com\/?p=5280"},"modified":"2025-10-25T16:51:19","modified_gmt":"2025-10-25T14:51:19","slug":"meine-ersten-stolperschritte-in-das-thema-kuenstliche-intelligenz","status":"publish","type":"post","link":"https:\/\/www.ollmetzer.com\/?p=5280","title":{"rendered":"Meine ersten Stolperschritte in das Thema K\u00fcnstliche Intelligenz"},"content":{"rendered":"\n<p>Seit einiger Zeit ist k\u00fcnstliche Intelligenz ein allgegenw\u00e4rtiges Thema. Ich bin da selber stets skeptisch gewesen. Jahrzenhnte lang was das Thema eher ein fahler Witz. Zudem &#8211; wie soll ich an k\u00fcnstliche Intelligenz glauben, wenn ich schon kaum an nat\u00fcrliche Intelligenz glaube? (siehe: Zustand der Welt)<\/p>\n\n\n\n<p>Zynismus beiseite &#8211; letztlich ist KI nur &#8222;Statistik auf Speed&#8220;. Die Grundlagen sind mathematisch verbl\u00fcffend banal. Das sollte jeder verstehen k\u00f6nnen, der sich durch das Abitur geboxt hat. Von neuronalen Netzen war auch bereits zu meiner Schulzeit in den 80ern die Rede. Der Grund, weshalb das Thema jetzt so abhebt, ist die Verf\u00fcgbarkeit von fr\u00fcher unvorstellbarer Rechenpower und digitalen Datenbergen.<br><br>Man muss zugeben, dass das Feld gerade explodiert. Texte, Bilder und Videos werden nach allen Regeln der Kunst und Manipulation zurechtgelogen und -gebogen. Selbstfahrende Autos haben (in den USA) bereits F\u00e4higkeiten, die sie durch normale Programmierung in den n\u00e4chsten 50 Jahren nicht erreicht h\u00e4tten. KI wird uns in den n\u00e4chsten Jahren \u00fcberrollen, wie es die Computer in den 80er und 90er Jahren gemacht haben. Millionen von Arbeitnehmern werden ihre Jobs verlieren &#8211; und zwar diesmal die hochqualifizierten Angestellten. H\u00f6chste Zeit also, sich das Ganze etwas n\u00e4her anzusehen.<\/p>\n\n\n\n<p><strong>Erste Schritte zwischen &#8222;Wow&#8220; und &#8222;Was zum Geier&#8230;&#8220;???<\/strong><\/p>\n\n\n\n<p>Bisher habe ich nur hier und da etwas Theorie gelesen, aber selbst noch nichts aktiv genutzt. Aus gegebenem Anlass besch\u00e4ftige ich mich jetzt selber mit diesem Thema. <br>Mein Ziel war es, eine Serie von Bildern inhaltlich analysieren zu lassen, und die Erkenntnisse zu verschlagworten. Dabei sollten nicht nur Objekte in den Bildern erkannt werden, sondern auch bestimmte Situationen, damit daraus Handlungsempfehlungen abgeleitet werden k\u00f6nnen.<\/p>\n\n\n\n<p>Noch vor f\u00fcnf Jahren h\u00e4tte ich abgewunken und &#8222;unm\u00f6glich&#8220; gesagt. Nun stehen mir etliche Werkzeuge aus der Microsoft Azure Cloud und GPT4 zur Verf\u00fcgung. Die Anwendung ist  nicht schwer zu programmieren, weil die eigentlich anspruchsvolle Arbeit ja von den Cloudservern erledigt wird. <\/p>\n\n\n\n<p>Ich musste nur daf\u00fcr sorgen, dass die Bilder nacheinander zur KI hochgeladen werden, die Antwort entgegennehmen und verarbeiten. Ach ja, und der &#8222;Prompt&#8220; muss nat\u00fcrlich sinnvoll sein. Damit sagt man der KI, was sie machen soll &#8211; und zwar in nat\u00fcrlicher Sprache.<\/p>\n\n\n\n<p>Erster Eindruck: Die Objekterkennung ist ziemlich gut. Man bekommt eine Liste von Dingen, die die KI auf dem Foto erkannt zu haben glaubt, zusammen mit einem &#8222;Confidence&#8220; Wert. Ein Eintrag wie &#8222;Hardhat (confidence: 0.93)&#8220; bedeutet sinngem\u00e4\u00df: &#8222;Ich bin mir zu 93% sicher, dass dort ein Bauarbeiterhelm ist&#8220;. In diesem Fall war es zwar ein roter Ball unter einem Schreibtisch &#8211; aber da der Kontext &#8222;Baustelle&#8220; war, ist das v\u00f6llig in Ordnung. Da muss man halt sp\u00e4ter noch mal mit einer Plausibilit\u00e4tspr\u00fcfung dr\u00fcber. Die anderen Dinge wurden verbl\u00fcffend korrekt erkannt.<\/p>\n\n\n\n<p>Aus den Objekten alleine kann man aber noch nicht viel ableiten. Die Beziehung untereinander und der Kontext ergibt eine Einsch\u00e4tzung der Situation. Und auch die ist verbl\u00fcffend gut gewesen.<\/p>\n\n\n\n<p>So wurde gelobt, dass das Bauger\u00fcst ordentlich aufgestellt war und bem\u00e4ngelt, dass die Bauarbeiter keine ausreichende Schutzkleidung trugen. Selbst potentiell gef\u00e4hrlich Situationen wurden erkannt &#8222;Bauarbeiter unter schwebender Kranlast&#8220;. Sehr sehr beeindruckend.<\/p>\n\n\n\n<p>Nun habe ich versucht die Analyseergebnisse selber weiter zu verarbeiten. Dazu m\u00fcssen sie in einen standardisiertes Format gebracht werden. Das ist an und f\u00fcr sich kein gro\u00dfes Thema: Man analysiert den R\u00fcckgabetext und erzeugt daraus Schlagworte die mit dem Bild verbunden werden.<\/p>\n\n\n\n<p>Dabei ist mir aber schnell einen Manko aufgefallen: Wenn ich der KI das identische Bild wieder und wieder vorlege, bekomme ich jedes mal andere Antworten. Das reicht von unterschiedlicher Wortwahl \u00fcber unterschiedliche Reihenfolge und Gewichtung und tats\u00e4chlich sind auch die erkannten Sachverhalte nicht v\u00f6llig identisch.<br>Das ist ein Verhalten wie es Menschen in einer Diskussion zeigen w\u00fcrden. Leider ist es damit aber v\u00f6llig ungeeignet um damit verl\u00e4ssliche Schlagwortlisten aufzubauen. Insbesondere wenn es um wirklich wichtige Themen wie Sicherheit geht und nicht nur um Smalltalk.<\/p>\n\n\n\n<p>So bin ich gerade etwas hin- und hergerissen. Einerseits ist die Bildanalyse wirklich beeindruckend. Andererseits macht die mangelhafte Reproduzierbarkeit das vern\u00fcnftige Arbeiten nahezu unm\u00f6glich.<\/p>\n\n\n\n<p><strong>Taugt das was? Ich wei\u00df noch nicht so recht&#8230;<\/strong><\/p>\n\n\n\n<p>Neulich habe ich einmal irgendwo gelesen, KI sei nur ein stochastischer Papagei, der Intelligenz vorgaukelt. Man k\u00f6nnte nat\u00fcrlich etwas b\u00f6sartig sagen, dass das auch f\u00fcr 85% der Menschen zutrifft.<\/p>\n\n\n\n<p>Von solchen philosophischen Betrachtungen abgesehen, habe ich wahrscheinlich nur noch nicht die richtigen Schalter und Parameter gefunden. Ich bleibe erst mal am Thema dran&#8230;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Seit einiger Zeit ist k\u00fcnstliche Intelligenz ein allgegenw\u00e4rtiges Thema. Ich bin da selber stets skeptisch gewesen. Jahrzenhnte lang was das Thema eher ein fahler Witz. Zudem &#8211; wie soll ich an k\u00fcnstliche Intelligenz glauben, wenn ich schon kaum an nat\u00fcrliche Intelligenz glaube? (siehe: Zustand der Welt) Zynismus beiseite &#8211; letztlich ist KI nur &#8222;Statistik auf [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[9,3,7,11],"tags":[],"class_list":["post-5280","post","type-post","status-publish","format-standard","hentry","category-development","category-gizmos","category-medienpolitikwirtschaft","category-onlinedienste"],"_links":{"self":[{"href":"https:\/\/www.ollmetzer.com\/index.php?rest_route=\/wp\/v2\/posts\/5280","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.ollmetzer.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.ollmetzer.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.ollmetzer.com\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.ollmetzer.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=5280"}],"version-history":[{"count":9,"href":"https:\/\/www.ollmetzer.com\/index.php?rest_route=\/wp\/v2\/posts\/5280\/revisions"}],"predecessor-version":[{"id":5529,"href":"https:\/\/www.ollmetzer.com\/index.php?rest_route=\/wp\/v2\/posts\/5280\/revisions\/5529"}],"wp:attachment":[{"href":"https:\/\/www.ollmetzer.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=5280"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.ollmetzer.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=5280"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.ollmetzer.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=5280"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}