Googles Project Euphonia: Was es ist und wie es Menschen mit atypischer Sprache helfen kann - BewertungenExpert.net

Die meisten Menschen verbinden den Americans with Disabilities Act mit physischen, infrastrukturellen Veränderungen, die an Gebäuden oder anderen Orten vorgenommen werden müssen, aber da die Definition von Behinderung erweitert wird, erkennen die Menschen, dass „zugänglich“ auch für Dinge wie Websites und Spracherkennung gilt.

In diesem Fall bemüht sich der Technologieriese Google mit Project Euphonia, seine Spracherkennungssoftware zu verbessern. Project Euphonia ist eine Initiative zur Aufnahme von Stimmproben von Freiwilligen und deren Analyse, damit Menschen mit ALS, neurologischen Störungen und anderen Sprachproblemen ihre intelligenten Geräte mit der Leichtigkeit einer „typischen“ Person nutzen können.

Warum ich mich freiwillig gemeldet habe

Eine gelähmte linke Stimmlippe und asymmetrische Zunge aufgrund eines Hirntumors haben zu meiner Sprachstörung Dysarthrie geführt. Meine undeutliche Sprache und meine schwache Stimme machen es für Freunde und Familie schwer, mich zu verstehen oder zu hören – besonders in einem überfüllten Raum. Dies machte mich zu einem erstklassigen Kandidaten für das Projekt Euphonia, also meldete ich mich freiwillig, sobald ich davon las. Als ich Samples auf einer rudimentären Website aufnahm, wiederholte ich 4.500 Sätze von „Wie komme ich nach Mountain View, Kalifornien?“ bis „Spiele Songs von Cardi B“.

Abgesehen davon, dass ich die Kriterien von Project Euphonia erfüllte, meldete ich mich freiwillig, weil ich 1997 zum ersten Mal in das führende Spracherkennungsprogramm Dragon Naturally Speaking eingeführt wurde – und es scheiterte spektakulär. Im Laufe der Jahre habe ich analoge Programme im Assistive Technology Lab des Boston’s Children’s Hospital sowie aktualisierte Versionen von . ausprobiert Drachen, und obwohl diese Software große Fortschritte gemacht hat, fällt es ihr immer noch schwer, meine Stimme zu lokalisieren.

Das ist aus zwei Gründen problematisch: Ich bin ein Schriftsteller mit mangelnder Feinmotorik, also tippe ich mit einer Hand oder langsam mit zwei, wenn ich müde bin. Mit drei selbstveröffentlichten Gedichtbänden, einer Abhandlung und einer Sammlung unveröffentlichter, verlinkter Geschichten zu meinem Namen, schaudere ich, wenn ich daran denke, wie viel mehr ich hätte produzieren können, wenn das Tippen nicht so eine körperlich anstrengende Aufgabe gewesen wäre.

Der andere Grund, warum eine unterdurchschnittliche Spracherkennung für mich eine Barriere darstellt, ist die Verbreitung von sprachaktivierten Produkten in Haushalten und auf Telefonen. Wenn ich nur mit meiner Geschichte auf Computer und intelligente Geräte zugreifen könnte, so wie sie verwendet werden sollen, würde ich mehr Freizeit haben, Aufgaben vollständig erledigen und möglicherweise meine Lebensweise verändern.

Projekt Euphonia: Wie funktioniert es?

Wie funktioniert Euphonia? Nachdem ich einen App-Prototyp mit einem personalisierten Spracherkennungsmodell auf mein Telefon heruntergeladen hatte, legte ich das Telefon neben meinen Laptop und diktierte hinein. dabei sah ich, wie alles, was ich sagte, in meinem Google-Dokument auf meinem Laptop erschien. Ich tat dies einige Monate lang, nahm Sätze aus einem Roman auf, den ich schrieb, und korrigierte alle Ungenauigkeiten für Google mithilfe der App.

Nach einigen weiteren Monaten ohne Phrasenaufnahme habe ich den ersten Entwurf eines Romans – 20.000 Wörter – mit der App fertiggestellt. Das soll nicht heißen, dass es makellos ist; Für jede Stunde, die ich schreibe, muss ich zurückgehen und eine Stunde damit verbringen, kleinere Korrekturen vorzunehmen. Aber es macht mir nichts aus, denn Euphonia befindet sich im Beta-Stadium und anstatt träge 100 Wörter pro Tag auszustanzen, generiere ich 500 Wörter pro Tag.

Dann ist da noch die Tatsache, dass Euphonia nicht für die Textverarbeitung entwickelt wurde - es ist eher für deklarative Befehle - und mein Schreibstil ist ein so genannter "Pantser" (fliege am Hosenboden vorbei), also habe ich viele Pausen weil ich nicht weiß, wie ein Satz enden wird - wissen Sie, wie Michael Scott. Wenn ich jedoch weiß, was ich sagen möchte, etwa in Texten, E-Mails oder Anweisungen an meine Assistentin, ist es mit Abstand die präziseste Spracherkennung, die ich je verwendet habe.

Wenn Institutionen wie Google den Behinderten eine Stimme bei der Gestaltung der Architektur der Zukunft geben und sie selbst bleiben lassen, anstatt sie in etwas „Normales“ umzuwandeln, lässt mich hoffen, dass im Zeitalter der KI der Humanismus siegen wird.

Wenn Sie die Website von Project Euphonia besuchen möchten oder eine Sprachbehinderung haben und eine Stimmprobe beisteuern möchten, können Sie diesen Link aufrufen: https://sites.research.google/eufonia/about/

Sie werden die Entwicklung der Website helfen, die Seite mit Ihren Freunden teilen

wave wave wave wave wave