Dokumentation

From Imskpe

Contents

Allgemeines

IMSKPE ist der Nachfolger von kpe80. Entwickelt unter Verwendung von GTK2.

Die deutsche Dokumentation ist Teil meiner Studienarbeit.

Oberfläche von IMSKPE

Menü

Image:Menubar.png

Unter File befinden sich die üblichen Operationen (New, Open, Save, Save As, Quit). Save As ermöglicht auch ein Speichern als WAV(16bit mono PCM little-endian). Das Standard-Dateiformat ist PAR. Bei Sets handelt es sich um die Möglichkeit Kurvensichtbarkeitszustände abzuspeichern. Das Default-Set bewirkt die Ausblendung aller Kurven. Wichtig hierbei ist, dass der Synthesealgorithmus alle Kurven verarbeitet, auch wenn sie nicht sichtbar sind! Unter Actions kann man mit Execute für die aktuelle Kurvenkonstellation eine WAV-Datei erzeugen, diese wird sofort mit dem in den Preferences angegebenen Abspielkommando ausgegeben. Interpolate bietet die Möglichkeit unnötige Punkte aus den Kurven zu entfernen. Dies ist aber immer mit Vorsicht zu verwenden. Die Interpolation hat Toleranzeinstellungen, die ein Löschen wichtiger Punkte verhindern soll. Dies kann aber nicht immer garantiert werden. Es ist sinnvoll vorher immer zu speichern.

Toolbar


Image:Toolbar-1.png

Der erste Teil der Toolbar besteht aus folgenden Operationen: Quit, Open,New, Save, Save As, Preferences, Execute, Refresh der WAV-Anzeige und Interpolate. Die meisten dieser Funktionen entsprechen den Funktionen im Menü. Ausschließlich in der Toolbar befindet sich die Schaltfläche für die Einstellungen und die Aktualisierung der WAV-Anzeige.


Image:Toolbar-2.png

Im rechten Teil der Toolbar kann der Modus gewählt werden. Bewegen, Einfügen und Löschen von Punkten auf den Kurven. Auf dem Anzeigebereich kann mittels eines Popupmenüs, welches mit der rechten Maustaste aktiviert wird, der Modus gewechselt werden. Falls eine Maus mit Scrollrad vorhanden ist, kann diese über dem Anzeigebereich auch zum Moduswechsel genutzt werden.

PAR-Kontrollbereich

Dateieigenschaften

Image:Tab-1.png

Duration bestimmt die Dauer des zu erzeugenden Signals in Millisekunden. Das Update-Intervall ist der Abstand zwischen den Parameterwerten. Hier sind Werte zwischen 2ms und 20ms möglich. Sinnvoll sind hier 10ms. Ein Wert von 5ms kann das Ergebnis leicht verbessern, ein niedrigerer Wert ist nicht sinnvoll. Beim Speichern der PAR-Datei werden die Kurven mit genau dem Punktabstand zerteilt, der durch das Update-Intervall festgelegt wird. Dies kann bei erneutem Laden dieser Datei dazu führen, dass mehr Punkte verwendet werden, um die Kurve zu beschreiben. Mit Hilfe der Interpolationsfunktion können einige der unnötigen Punkte entfernt werden. Die Samplingrate ist im Default auf 16kHz gesetzt. Dennis Klatt verwendet in Klatt (1980) 10kHz. Bei 10kHz klingt das synthetisierte Signal etwas heller und meist besser. Nur ist 10kHz ein sehr ungewöhnliches Format für den WAV-Export und wird möglicherweise nicht von allen Abspielwerkzeugen unterstützt. Die Anzahl der Formanten darf zwischen drei und sechs liegen. Der Standard liegt bei fünf Formanten. Die Stimmquelle (voice source) kann entweder naturgetreu (natural), impulsed oder digitalisiert (sampled) sein, wobei die letztere Methode (sampled) sehr unzuverlässig funktioniert. Der klatt80-Algorithmus kann entweder nur einen Parallel-Zweig (Branch) oder einen kaskadierten und parallelen Zweig umfassen.

Formantwerte

Image:Tab-2.png

Für jeden Formanten können die Kurven zur Frequenz, der Amplitude, der Bandbreite und der Bandbreite im parallelen Zweig angezeigt werden. Hierbei gilt, auch wenn die Kurve nicht sichtbar ist, wird sie im Algorithmus verwendet.

Nasalparameter

Image:Tab-3.png

Für die Synthetisierung von Nasalen kann die Frequenz der Auslöschung (zero frequency) und deren Bandbreite in Form einer Kurve eingestellt werden. Auch die Kurven für die Frequenz, Bandbreite und Amplitude des Maximums (pole frequency, bandwidth, amplitude) werden in diesem Tab aktiviert.

Voice Source Parameter

Image:Tab-4.png

Die fundamental frequency entspricht der Grundfrequenz (F0). Glottal open quotient (Parameter: kopen) entspricht der Länge oder Dauer der Öffnung der Glottis in Samples. Ein Wertebereich von 10 bis 65 ist möglich. Mit breathiness kann die Behauchtheit der Stimmquelle angepasst werden. Spectral tilt und skewness geben die Neigung der Stimmquelle im Spektrum an.

Erweiterte Amplitudenparameter

Image:Tab-5.png

Overall signal gain ist die Lautstärke des Signals. Mit amp. of voicing (AV) kann die Kurve für die Amplitude der Phonation sichtbar gemacht werden. Amp. of voicing (par) (AVP) ist das entsprechende im parallelen Zweig. Mit amp. of frication (AF) und amp. of aspiration (ASP) werden die entsprechenden Amplitudenkurven sichtbar. AB (amp. of bypass path(par)) umgeht den parallelen Zweig.

Preferences

Die Einstellungen werden beim Beenden von imskpe automatisch gespeichert. Beim ersten Start wird ein default angenommen, der mit dem Default-Button jederzeit wieder herstellbar ist. Die Einstellungen werden in der Datei .imskpe im HOME-Verzeichnis des Benutzers gespeichert.

Farben der Kurven

Image:Prefs-1.png

Dieser Dialog ermöglicht es, jedem Formanten eine Farbe zuzuweisen, wobei Frequenz, Amplitude und Bandbreite des jeweiligen Formanten die gleiche Farbe haben.

Lineal

Image:Prefs-2.png

Die Lineale der drei Diagramme sind standardmäßig auf ihre maximalen Werte eingestellt. Diese sind in vielen Fällen zu groß und können hier geringer eingestellt werden. Zudem kann die Schriftart jedes Lineals verändert werden. Die voreingestellte Schriftart sollte auf allen Plattformen zur Verfügung stehen.

Pfade

Image:Prefs-3.png

Im Dialog Paths kann der Pfad für das Ziel der temporären Dateien angegeben werden. Bei jedem Aufruf von Execute wird eine temporäre Datei angelegt. Bei einem erneuten Aufruf von Execute innerhalb derselben Session, also ohne Neustart von IMSKPE, wird die Datei überschrieben. Um die temporären Dateien voneinander zu unterscheiden und es mehreren Benutzern zu ermöglichen auf demselben System mit IMSKPE zu arbeiten, steht im Dateinamen der temporären Datei die Prozessnummer der IMSKPE-Instanz. Die erzeugten temporären Dateien werden nicht gelöscht. Auch der Befehl, der zum Abspielen der resultierenden WAV-Datei beim Ausführen verwendet wird, kann hier festgelegt werden. Unter Linux/Unix ist dies meist play oder aplay. Unter Windows ist der mitgelieferte Soundrecorder die Voreinstellung (sndrec32 /play /close).

Verschiedenes

Image:Prefs-4.png

Verschiedenes beinhaltet die Art der Toolbar (nur Icons, nur Text oder beides) und ob ein "Wirklich beenden"-Dialog angezeigt werden soll oder nicht.

Diagrammfläche

Um eine Kurve zu editieren, muss sich der Mauscursor über der Kurve befinden. Zum Editieren gibt es drei verschiedene Modi: Bewegen, Einfügen und Löschen eines Punktes. Der Modus kann durch Klicken der Icons in der Toolbar geändert werden, durch das mit der rechten Maustaste erreichbare Kontextmenü, und als dritte Möglichkeit - falls vorhanden - mit dem Scrollrad der Maus. Im Kontextmenü gibt es zudem die Möglichkeit, den Wert des Punktes exakt einzugeben. Punkte haben einen Mindestabstand zueinander, der durch das Updateintervall festgelegt wird.

Statuszeile

In der Statuszeile wird, sofern der Cursor sich über der Diagrammfläche befindet, der aktuelle Wert der beiden Koordinaten angezeigt. Wenn der Mauscursor sich über einer Kurve oder einem Punkt befindet, werden der Name der Kurve und die Koordinaten des Punktes angegeben.

Beispielsitzungen

Views