Zitat:
Mitterbacher, A. (2004). Neue Signalverarbeitungs- und Stimulationsstrategien für Cochlea Implantate [Dissertation, Technische Universität Wien]. reposiTUm. http://hdl.handle.net/20.500.12708/181895
-
Publikationstyp:
Hochschulschrift - Dissertation
de
Sprache:
Deutsch
-
Datum (veröffentlicht):
2004
-
Umfang:
137
-
Keywords:
Cochlear-Implantat; Signalverarbeitung; Stimulation; Sprachtest; Sprachprozessor
de
Abstract:
In den letzten Jahren ist die Qualität der Cochlea Implantat Systemen ständig verbessert worden. Dafür waren auch neue Signalverarbeitungs- und Stimulationsstrategien verantwortlich. Trotzdem bleibt die Klangqualität noch unter der des 'normalen' Hörens, vor allem bei Hintergrundgeräuschen und auch beim Hören von Musik. In dieser Arbeit sind drei neue Strategien implementiert, evaluiert und teilweise weiterentwickelt worden: (1)Continous interleaved sampling (CIS) Filterbank im Frequenzbereich mit Hilfe der Fast Fourier Transformation.<br />(2) Parallele Stimulation von Kanälen bei gleichzeitiger Korrektur des Kanalübersprechens. (3) Übertragung der Feinstruktur mit Hilfe von kanalspezifischen Sequenzen (CSSS). Die erwähnten Strategien wurde in einem speziell für diese Anwendung entwickelten PC basierten Laborsystem implementiert (CILab ). Im Vergleich zu DSP oder ASIC basierten Sprachprozessoren weist CILab deutlich reduzierte Entwicklungszeiten und einen höheren Grad an Flexibilität auf. CILab bietet einen Echtzeit-Modus welcher mit einem 'normalen' Sprachprozessor vergleichbar ist. Weiters bietet CILab ein Sprachtest-Modul mit dem Sprachtests weitgehend automatisiert durchgeführt werden können, ein Modul mit dem interval forced choice Tests durchgeführt werden können sowie ein Modul mit dem Stimulationsmuster grafisch dargestellt werden können. Zur Gewährleistung der Patientensicherheit ist eine galvanische Trennung vorgesehen. Bei der Evaluation der Strategien wurden Sprachtests (Konsonanten, Vokale und Einsilber), sowie psychoakustische Tests (adaptive IFC Tests) verwendet. Diese Test wurden mit Benutzern der MED-EL C40 und C40+ Implantate sowie mit Benutzern des INERAID Systems durchgeführt. Bei letzteren wurden die Stimulationssignale über den Hautstecker direkt an das Elektrodenarray geleitet. Zur Bestimmung der patientenspezifischen Parameter wurden Lautheitsskalierungs- und Lautheitsvergleichsmethoden angewandt. Bei der FFT basierten Filterbank war die Länge des Fensters ein wesentlicher Parameter. Bei mittleren Fensterlängen (10ms) war die Performance mit einer FIR Filterbank vergleichbar, bei längeren Fenstern hatten die Versuchspersonen Probleme männliche und weibliche Sprecher zu unterscheiden. Idealerweise würde für jeden einzelnen Kanal eine bestimmte Fensterlänge angewandt. Um die Effizienz des FFT Algorithmus nutzen zu können, muss jeder Kanal der Filterbank mit Hilfe der selben Berechnung des Spektrums realisiert werden. Das bedeutet, dass die Fensterlänge für alle Kanäle konstant ist. Dies ist ein Nachteil im Vergleich zu einer FIR Filterbank, bei der für jeden Kanal eine bestimmte Impulsantwortlänge eingestellt werden kann. Über die variable Impulsantwortlänge kann bei einer FIR Filterbank auch elegant die Laufzeit der Wanderwelle in der Cochlea simuliert werden. Dazu verwendet man für die apikalen Kanäle längere Impulsantworten als für die basalen Kanäle. Dieses Verhalten kann bei der FFT basierten Filterbank nur schwer realisiert werden. Bei paralleler Stimulation verbessert der Einsatz des Korrektur-Algorithmus die Ergebnisse deutlich. Die Stimulation von zwei parallelen Kanälen mit Korrektur brachte ähnliche Ergebnisse wie CIS. Werden zwei parallele Kanäle ohne Anwendung des Korrektur Algorithmus verwendet, sind die Ergebnisse der Sprachtests signifikant schlechter als bei CIS. Dies zeigt, dass der Korrektur-Algorithmus eine Verbesserung bringt. Der Ausgleichs-Algorithmus verwendet zwei Abklingkonstanten alpha und beta, die von Patient zu Patient verschieden sein können. Die Ergebnisse der Sprachtests zeigten, dass die genaue Einstellung der Werte nicht sehr kritisch ist. Für eine Abschätzung der Werte für alpha und beta werden drei Methoden vorgeschlagen. Parallele Stimulation kann dazu verwendet werden, die Stimulationsrate pro Kanal zu erhöhen, oder um die Phasendauer der Stimulationspulse zu erhöhen. Eine hohe Stimulationsrate ist für die Kodierung der Feinstruktur eine Voraussetzung. Eine verlängerte Phasendauer verringert die für die Stimulation notwendige Versorgungsspannung, dies könnte den Einsatz neuer Batterie- und Akkutechnologien ermöglichen. Die weit verbreitete CIS Stimulationsstrategie verwendet die Einhüllende der Filterausgangssignale zur Berechnung der Stimulationsamplitude. Die in den Signalen enthaltenen Phaseninformation, die auch als Feinstruktur des Signals bezeichnet wird, geht dabei verloren. Im Gegensatz dazu werden bei der neuen CSSS Strategie bei jedem Nulldurchgang der Filterausgänge kanalspezifische Sequenzen gestartet. Die Phaseninformation ist daher im Stimulationssignal weitgehend enthalten.<br />In der Literatur wird berichtet, dass die Feinstruktur vor allem für die Tonhöhenempfindung eine große Rolle spielt. Für das Verstehen von Sprache ist eher die Einhüllende von Bedeutung. Die CSSS Strategie wurde in CILab implementiert und mit Patiententests evaluiert. Dabei zeigte sich keine große Verbesserung in Sprachtests, beim Unterscheiden von verschiedenen Tonhöhen brachte CSSS allerdings eine deutliche Verbesserung. Dies zeigt, dass es mit der CSSS Strategie die Übertragung der Feinstruktur möglich ist. Die bessere Unterscheidbarkeit von Tonhöhen ist ein Hinweis darauf, dass die Klangqualität beim Hören von Musik mit Hilfe von CSSS verbessert werden kann. Ebenso sollten bilaterale CI-Träger bei der Lokalisierung von Geräuschquellen profitieren.<br />
de
In the last few years remarkable progress has been made in improving the performance of cochlear implant systems. New signal processing and stimulation strategies played a major role. Despite that modern systems still do not offer 'normal' sound quality, even for top performers and particularly in noisy environments or for listening to music. In this work three new processing strategies have been implemented, evaluated and partly further developed: (1)Implementation of a Continuous interleaved sampling (CIS) filter bank in the frequency domain using the fast fourier transform. (2)Parallel stimulation of channels and correction of the current spread. (3)Encoding of the fine structure by stimulation of channel specific sequences (CSSS). All three were implemented in a PC based laboratory processor (CILab ) which has been developed for that purpose. Compared to DSP or ASIC based processors CILab offered rapid development times and a very flexible test environment. CILab offers a real-time mode which is comparable to a 'normal' CI speech processor, it also offers automated speech tests, supports interval forced choice methods and allows to display stimulation patterns on the screen. The CILab system also includes a galvanic isolation to ensure patient safety. To evaluate the mentioned strategies speech tests (consonant, vowel, monosyllables) and psychoacoustic tests (adaptive IFC) were used. The mentioned tests were done with users of the MED-EL C40 and C40+ implant systems and with INERAID users. In the latter case the stimuli were applied directly via the transcutaneous plug. Loudness scaling and loudness balancing were used to set the patient specific parameters. The performance of the FFT based filter bank depended on the window length, at 10ms it was comparable good as with FIR filters. At longer windows CI-users had problems in distinguishing between male and female voices. Ideally the FFT window length would be set for each channel separately. To benefit from the efficiency of the FFT algorithm, however, the same computation of the spectrum has to be used for all channels of the filter bank. The fact that the window length has to be the same for all channels is a major disadvantage compared to a FIR filter bank. In addition the variable impulse response length of a FIR filter bank allows to model the delay of the travelling wave in the cochlea. In order to do that the more apical channels use longer impulse response lengths than the more basal channels. In parallel stimulation the use of the algorithm which corrects the current spread improved the performance significantly compared to uncorrected stimulation. The speech test results of the corrected stimulation of two channels in parallel were similar to CIS.<br />Without correction the results of the speech tests were significantly worse than in CIS. This shows that the correction algorithm works. The algorithm uses the two parameters alpha and beta (decay coefficient towards the apex and base) which differ from patient to patient.<br />According to the results of the speech tests the performance of the correction algorithm does not depend on a very precise setting of alpha and beta. In this work three methods to estimate the two parameters are described. Parallel stimulation can be used to rise the stimulation rate per channel, or alternatively to use wider pulses at the same rate per channel. High stimulation rates are desired for fine structure strategies. In these strategies higher rates lead to a more precise coding of the phase of the audio signal. Wide stimulation pulses can help to reduce the supply voltage of the implant. Lower supply voltages could help to use new battery technologies. The standard CIS strategy uses the envelope of the filter output signal to compute the amplitude of the stimulation pulses. For that reason no phase information is encoded. To avoid that the new CSSS strategy starts sequences of stimulation pulses at every zero-crossing of the band pass filter signal. The phase of the signal is therefore included in the stimulation pulses, the fine structure of the signal can be delivered to the patient. According to reports in the literature the fine structure plays an important role for pitch sensations and for listening to music. For listening to speech the envelope seems to be more important. The CSSS strategy was implemented in CILab and evaluated using speech tests and psycho-acoustic tests. CSSS was comparable to CIS in vowel and consonant tests but improved performance in pitch discrimination tests. The latter results promise that it is possible to encode the fine structure with the CSSS strategy. The improved performance in the pitch discrimination tasks indicates that the strategy could offer an improved sound quality when listing to music. For bilateral patients the fine structure should also increase the ability to localize sound sources in the horizontal plane.
en
Weitere Information:
Zsfassung in engl. Sprache
-
Enthalten in den Sammlungen: