Diplomarbeit, 2005
153 Seiten, Note: 1.3
1 Einleitung
1.1 Motivation
1.2 Problemstellung und Eingrenzung
1.3 Ziele der Arbeit
2 Grundlagen
2.1 Begriffsklärung
2.1.1 Zugänglichkeit
2.1.2 Benutzbarkeit
2.2 Überprüfen der Hardwarezugänglichkeit und Benutzbarkeit
2.3 Erstellung und Überprüfen von zugänglichen Informationsangeboten
2.3.1 Richtlinienerstellende Autorität - Web Accessibility Initiative des W3C
2.3.2 WCAG 1.0 Richtlinie zur Gestaltung von zugänglichen Webangeboten
2.3.3 Software zur Überprüfung der Einhaltung der Richtlinien
2.4 Multimodale Schnittstellen
2.4.1 Begriffsbestimmung und Entwicklungsprozess multimodaler Schnittstellen
2.4.2 Vorteile multimodaler Schnittstellen
2.4.3 Zielgruppe für den Einsatz multimodaler Schnittstellen
2.4.4 Erweiterung der Modalität durch spezielle Hard- und Software
2.4.5 Multimodale Software mit Schwerpunkt auf Spracherkennung; Stand der Technik
2.5 Das Prinzip der Spracherkennung durch Rechnersysteme
3 Entwicklungskonzept einer multimodalen Sprachanwendung
3.1 Der Einsatz von sprachgesteuerten Diensten
3.2 Verbesserung der Zugänglichkeit von Informationssystemen
3.3 Einsatzgebiete von Sprachanwendungen
3.4 Integration der späteren Nutzer in den Entwicklungsprozess von Sprachschnittstellen
3.5 Graphische Anwendung kontra Sprachanwendung
3.6 Besonderheiten von Sprache als Kommunikationsmedium
3.7 Fehler und Fehlerkorrektur der Spracherkennung
3.7.1 Häufige Fehlerquellen für keine oder falsche Worterkennung
3.7.2 Fehlerhafte Erkennung von Befehlen
3.7.3 Techniken zur Fehlerkorrektur durch den Benutzer
3.8 Prototypenevaluation mit Hilfe eines Fragebogens
3.9 Übersichtsskizze
4 Umsetzung des Konzeptes für den Interaktiven Spiegel des ShopLab Projektes
4.1 Vom ShopLab Projekt zum Interaktiven Spiegel
4.2 Hardwarezugänglichkeit des Interaktiven Spiegels
4.2.1 Untersuchung der Hardware mit Hilfe der IBM Richtlinie
4.2.2 Ergebnisse der Untersuchung nach den IBM Richtlinien
4.2.3 Verbesserungsvorschläge
4.3 Ist der Einsatz von Sprachein- oder ausgabe sinnvoll?
4.4 Einbeziehung des Nutzers durch eine Natural Dialog Study
4.5 Auswahl verschiedener Entwicklungswerkzeuge
4.6 Umsetzung verschiedener Ansätze zur Spracherkennung
4.6.1 Spracherkennung mit Sphinx4
4.6.2 Microsoft Speech SDK
4.6.3 Speech for Java
4.6.4 Einsatz von Voice Tools for SMAPI
4.6.5 Funktionsskizze der untersuchten Entwicklungswerkzeuge
4.7 Umsetzung der Sprachanwendung mit Voice Tools for SMAPI
4.7.1 Punkteplan zur Programmierung der Sprachanwendung
4.7.2 Programmierung der Oberfläche
4.7.3 Programmierung der Sprachbefehle
4.7.4 Erweiterbarkeit um neue Befehle
4.8 Fragebogenevaluation des Prototypen
5 Zusammenfassung und Ergebnis
5.1 Erreichte Ziele
5.2 Ausblick
6 Literaturverzeichnis
7 Glossar
A Anlagenübersicht
B Anhang
B.1 Quellcode, Voice Tools for SMAPI
B.2 Quellcode, Java for Speech
B.3 Evaluationsbogen
Die vorliegende Diplomarbeit befasst sich mit der Barrierefreiheit in der Informationsgesellschaft und dem Einsatz multimodaler Benutzerschnittstellen, um den Informationszugriff für diverse Nutzergruppen – insbesondere für körperlich Benachteiligte und ältere Menschen – zu verbessern. Ziel ist die Entwicklung eines Konzepts für sprachgesteuerte Anwendungen, das am Beispiel eines „Interaktiven Spiegels“ innerhalb des ShopLab-Projekts praktisch implementiert und evaluiert wird.
Besonderheiten von Sprache als Kommunikationsmedium
Sprache ist das natürlichste Kommunikationsmedium des Menschen seit Tausenden von Jahren, spielte jedoch lange Zeit in der Mensch - Maschine - Kommunikation im Privatanwenderbereich keine Rolle. Dies lag einerseits an fehlender, zuverlässiger Software, andererseits an den beschränkten Rechnerressourcen der Heimcomputer.
Beides steht heute zur Verfügung. Um gute Sprachanwendungen entwickeln zu können, ist es notwendig sich mit den Besonderheiten der Sprache als Ein- und Ausgabemedium eingehend zu beschäftigen.
Sprache ist flüchtig, Gehörtes oder Gesagtes ist verschwunden, sobald es ausgesprochen wurde. Grafische Oberflächen dagegen sind dauerhaft. Beim Einsatz von Sprache wird häufig nur das Kurzzeitgedächtnis verwendet, aufgrund dessen kann sich der Nutzer nur eine begrenzte Zahl von gesprochenen und gehörten Befehlen und Informationen merken.
Auffällig ist dies besonders bei Spracherkennungssystemen mit Diktiermöglichkeit. Der Nutzer kann sich schon häufig direkt nach dem Sprechen nicht mehr an den genauen Wortlaut erinnern.
Die Unfähigkeit sich gehörte Informationen genau zu merken hat erheblichen Einfluss auf die Entwicklung von Sprachschnittstellen zwischen Mensch und Computer.
1 Einleitung: Motivationsgrundlage aus dem ShopLab-Projekt sowie die Problemstellung bezüglich der zunehmenden Komplexität von Informationen und der Notwendigkeit multimodaler Bedienkonzepte.
2 Grundlagen: Definition zentraler Begriffe wie Zugänglichkeit und Benutzbarkeit, sowie die Untersuchung bestehender Richtlinien (W3C, IBM) und Ansätze für multimodale Schnittstellen.
3 Entwicklungskonzept einer multimodalen Sprachanwendung: Ein systematisches Konzept zur Planung von Sprachschnittstellen, inklusive der Einbeziehung von Nutzern, Fehlerkorrekturstrategien und dem Vergleich zu grafischen Oberflächen.
4 Umsetzung des Konzeptes für den Interaktiven Spiegel des ShopLab Projektes: Beschreibung der praktischen Implementierung eines Prototypen, inklusive der Auswahl von Tools und der Durchführung einer Natural Dialog Study.
5 Zusammenfassung und Ergebnis: Reflexion über die erreichten Ziele des Projekts sowie eine abschließende Bewertung des entwickelten Konzepts und dessen praktischer Anwendung.
Universal Access, Mensch-Computer-Interaktion, Barrierefreiheit, Multimodalität, Spracherkennung, Sprachsteuerung, Benutzbarkeit, Usability, W3C, WCAG 1.0, Interaktiver Spiegel, ShopLab, Natural Dialog Study, Voice Tools for SMAPI, Prototypenevaluation
Die Arbeit untersucht, wie multimodale Benutzerschnittstellen, insbesondere sprachgesteuerte Systeme, den barrierefreien Informationszugriff in der Informationsgesellschaft verbessern können.
Die Arbeit fokussiert sich auf Hardwarezugänglichkeit, barrierefreie Informationsangebote, multimodale Interaktionstechniken und das spezifische Design von Sprachanwendungen.
Das Hauptziel ist die Erstellung eines Entwicklungskonzepts für Sprachanwendungen und dessen praktische Überprüfung anhand eines Prototypen für ein Interaktives Spiegelsystem.
Neben der theoretischen Analyse von Zugänglichkeitsrichtlinien wird ein "Natural Dialog Study"-Ansatz zur Datengewinnung genutzt, gefolgt von einer Prototypenevaluation mittels Fragebögen.
Der Hauptteil erarbeitet ein Konzept für Sprachanwendungen, beleuchtet Unterschiede zwischen grafischen und sprachbasierten Interfaces und beschreibt die Umsetzung der Sprachsteuerung im ShopLab-Projekt.
Die Arbeit wird durch Begriffe wie Barrierefreiheit, Spracherkennung, Multimodalität, Benutzbarkeit, ShopLab-Projekt und Natural Dialog Study definiert.
Die Hardware wurde mit Hilfe der "IBM Hardware peripherals accessibility Checklist" systematisch auf Aspekte wie Steuerelemente, Tasten, Kontrast und Audio untersucht.
Diese Studie ist entscheidend, um den Wortschatz und die Grammatik der Nutzer für die Sprachbefehle authentisch zu erfassen und eine hohe Akzeptanz der Sprachsteuerung zu erzielen.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

