Diktieren, Spracherkennung und Sprache 4.0

Claus Michael Sattler - Diktieren, Spracherkennung und Sprache 4.0

Mein Portfolio

Spra­che in digi­ta­len Pro­zes­sen zu nut­zen, ist eine zeit­ge­mä­ße Art der Daten­er­fas­sung, Tex­ter­stel­lung und Doku­men­ta­ti­on. Dabei unter­schei­de ich zwi­schen

  • dem Dik­tie­ren,
  • der Sprach­er­ken­nung und
  • der Spra­che 4.0.

Diktieren

Dik­tie­ren ist nichts ande­res als Sprach­auf­zeich­nung, so wie man das von alten Dik­tier­ge­rä­ten her kennt. Bei Dic­ta­Team arbei­te­te ich gemein­sam mit dem Ent­wick­ler­team an der welt­weit bewähr­ten und kos­ten­lo­sen Dik­tier-App dic­ta­te on demand mobi­le Fre­emi­um sowie an der kos­ten­pflich­ti­gen, pro­fes­sio­nel­len Ver­si­on dic­ta­te on demand mobi­le Enter­pri­se. Die kos­ten­lo­se Fre­emi­um-Ver­si­on kann über den Goog­le PlayS­to­re und den Apple AppSto­re her­un­ter­ge­la­den wer­den.

Spracherkennung

Sprach­er­ken­nungs­sys­te­me, wie z.B. Dra­gon Natu­ral­ly­Speaking, Dra­gon Group, Dra­gon Any­whe­re, Micro­soft Cor­ta­na und SIRI sowie Goog­le Docs, sind in aller Mun­de. Die­se Soft­ware-Sys­te­me für Sprach­er­ken­nung set­zen gespro­che­nes Wort – Spra­che – in geschrie­be­nen Text um. Dabei unter­schei­det man zwi­schen der Online-Sprach­er­ken­nung und der Off­line-Sprach­er­ken­nung.
Für die Online-Sprach­er­ken­nung am PC set­ze ich auf die Head­sets von Jabra.
Bei der Off­line-Sprach­er­ken­nung dik­tiert die Autorin oder der Autor ins Smart­pho­ne-Dik­tier­ge­rät, z.B. die Dik­tier-App dic­ta­te on demand mobi­le von Dic­ta­Team, schickt das Dik­tat an einen auto­ma­ti­sier­ten Sprach­er­ken­nungs­ar­beits­platz und erhält den fer­tig tran­skri­bier­ten Text zurück.

Sprache 4.0

In Anleh­nung an den Aus­druck „Indus­trie 4.0“ prä­ge ich der­zeit den Fach­be­griff „Spra­che 4.0“ in der Bran­che. Spra­che 4.0 bedeu­tet im Rah­men der Digi­ta­li­sie­rung nicht nur das digi­ta­le Auf­zeich­nen von Klän­gen und die auto­ma­ti­sier­te Tran­skrip­ti­on durch eine Soft­ware für die Sprach­er­ken­nung, son­dern auch die Kom­bi­na­ti­on aus allen mög­li­chen Infor­ma­tio­nen, die auf Smart­pho­nes, Tablet-PC, MP3-Play­ern und PC sowie MAC­books mit Spra­che kom­bi­niert wer­den kön­nen. Dies sind z.B. Bil­der, GPS-Daten, Rou­ten-Infor­ma­tio­nen, Visi­ten­kar­ten, Daten­bank­sys­te­me für die Wei­ter­ver­ar­bei­tung der Tex­te etc.

Realisierte Projekte

Diktieren

Claus Michael Sattler - Diktieren per Smartphone mit dictate on demand mobile

Spracherkennung

Claus Michael Sattler - Spracherkennung mit Headsets von Jabra

Sprache 4.0

Claus Michael Sattler - Sprache 4.0

Ein Kran­ken­haus benö­tig­te ein mobi­les Dik­tier­sys­tem und einen exter­nen Schreib­dienst. Für die Migra­ti­on von kas­set­ten­ba­sier­ten Dik­tier­ge­rä­ten in die heu­ti­ge Sprach­ver­ar­bei­tung ent­schied sich der Kun­den gemein­sam mit mir gegen sog. digi­ta­le Dik­tier­ge­rä­te und für den Sprung in die Smart­pho­ne-Dik­tier­ge­rä­te-Tech­no­lo­gie. So konn­ten wir den fol­gen­den Geschäfts­pro­zess rea­li­sie­ren:

  1. Die Ärz­tin­nen und Ärz­te dik­tie­ren den Inhalt des Doku­men­tes in das Smart­pho­ne.
  2. Anschlie­ßend scan­nen die Ärz­te die Pati­en­ten-Nr. ein oder rufen die Schnitt­stel­le zum KIS, RIS, Pacs, AIS oder zur ePA auf und wäh­len die jewei­li­ge Pati­en­tin oder Pati­en­ten aus. Durch die Pati­en­ten-Infor­ma­tio­nen ist die spä­te­re Zuord­nung des Tex­tes zum Pati­en­ten sehr ein­fach mög­lich.
  3. Zur Tran­skrip­ti­on sen­den die Ärz­te ihre Dik­ta­te per WLAN / WiFi oder per mobi­lem Daten­funk an das Schreib­bü­ro.
  4. Den Rest erle­digt der inter­ne Schreib­pool der Kli­nik bzw. der exter­ne medi­zi­ni­sche Schreib­dienst.

Der Kun­de und ich setz­ten dabei auf die Smart­pho­ne-Dik­tier­ge­rä­te-Lösung dic­ta­te on demand mobi­le von Dic­ta­Team sowie den exter­nen Schreib­dienst von Dic­ta­Team.

Ein Anbie­ter von Call-Cen­ter-Dienst­leis­tun­gen –Inbound Out­bound –, hat­te das Ziel, dass die Mit­ar­bei­te­rin­nen und Mit­ar­bei­ter ihre Noti­zen zu geführ­ten Tele­fo­na­ten schnel­ler in der Soft­ware des Call-Cen­ters bereit­stel­len, als sie es hän­disch über die Tas­ta­tur des PC kön­nen.
Das Mit­tel der Wahl ist nach über­ein­stim­men­der Mei­nung des Kun­den und von mir eine Soft­ware für die pro­fes­sio­nel­le Online-Sprach­er­ken­nung. Die­se Sprach­er­ken­nungs­soft­ware wur­de von mir als Inte­rim CTO im Call-Cen­ter instal­liert, ein­ge­führt und das Per­so­nal geschult.
Ab sofort kön­nen die Mit­ar­bei­te­rin­nen und Mit­ar­bei­ter des Call-Cen­ters ihre Noti­zen per Sprach­er­ken­nung in den Mas­ken ihrer Call-Cen­ter-Soft­ware erfas­sen. Auch die Wech­sel zwi­schen Daten­fel­dern und Erfas­sungs­sei­ten erfolgt per Sprach­be­feh­len.
Dazu nut­zen die Call-Cen­ter-Mit­ar­bei­te­rin­nen und -Mit­ar­bei­ter das glei­che Jabra Head­set, das sie auch für die Tele­fo­na­te nut­zen. So waren wei­te­re Inves­ti­tio­nen in zusätz­li­che Mikro­fo­ne über­flüs­sig.

Ein inter­na­tio­nal agie­ren­des Immo­bi­li­en-Mak­ler-Unter­neh­men woll­te die Expo­sés ihrer Objek­te nicht mehr auf­wän­dig gestal­ten, son­dern durch die Ver­bin­dung aller Medi­en, die Smart­pho­nes, Tablet-PC oder MP3-Play­er anbie­ten, auto­ma­ti­siert erstel­len und in die Immo­bi­li­en-Ver­wal­tungs-Soft­ware des Unter­neh­mens auto­ma­ti­siert über­neh­men las­sen.
Für die­se Auf­ga­ben­stel­lung ent­schied sich auch die­ser Kun­de in Abspra­che mit mir für die Doku­men­ta­ti­ons­lö­sung dic­ta­te on demand mobi­le von Dic­ta­Team. Der fol­gen­de Geschäfts­pro­zess wird nun abge­bil­det:

  • Die Immo­bi­li­en-Mak­le­rin­nen und -Mak­ler spre­chen den Inhalt des Expo­sé in das Smart­pho­ne-Dik­tier­ge­rät.
  • Wäh­rend der Sprach­auf­zeich­nung hal­ten die Mak­ler das Dik­tat an und foto­gra­fie­ren die Räu­me, Raum­aus­stat­tung, den Gar­ten etc. und dik­tie­ren danach wei­ter.
  • Gleich­zei­tig wird die Posi­ti­on der Mak­ler in den Gebäu­den per GPS ver­mes­sen.
  • Nach der Fer­tig­stel­lung des gespro­che­nen Expo­sés schi­cken die Mak­ler die Dik­tat-Datei, die Fotos und die zusätz­lich auto­ma­tisch erfass­ten Daten an einen auto­ma­ti­sier­ten Sprach­er­ken­nungs­ar­beits­platz.
  • Dort wird das Dik­tat durch die Sprach­er­ken­nungs­soft­ware tran­skri­biert und die Bil­der an den Stel­len auto­ma­tisch ein­ge­fügt, an denen sie wäh­rend des Dik­ta­tes foto­gra­fiert wur­den.
  • Das so erstell­te Expo­sé steht also weni­ge Minu­ten nach dem Dik­tat bereits zur wei­te­ren Ver­wen­dung zur Ver­fü­gung.
  • Schließ­lich wer­den alle Bestand­tei­le des Expo­sés auto­ma­tisch in die Immo­bi­li­en­ver­wal­tungs­soft­ware und ihre Daten­bank impor­tiert und von dort aus auf den bekann­ten Immo­bi­li­en­por­ta­len ver­öf­fent­licht.