Elmaz, O. (2010). Frequenzbasierte Lehrmaterialien für die arabische Mediensprache [Diploma Thesis, Technische Universität Wien]. reposiTUm. http://hdl.handle.net/20.500.12708/159830
language statistics; corpus lingusitics; foreign language instruction; computational linguistics; frequency dictionary; collocations; Media Arabic; al-Jazeera; Arabic; Media
Lehrwerke für die arabische Mediensprache, die sich nicht zuletzt auf Grund der Popularität des Senders al-Jazeera und der modernen Notwendigkeit, die arabische Perspektive zu reflektieren, in universitären Curricula einnistet, sind kaum vorhanden und wenn doch, so sind sie proprietär und auf das Heimatinstitut der Verfasser zugeschnitten, was deren Verwendung in Hinsicht auf Vorkenntnisse deutlich einschränkt. Hinzu kommt, dass die durch die arabische Multiglossie bedingte Problematik der gesprochenen Mediensprache bisher fast keine Erwähnung fand. Die vorliegende Arbeit versteht sich als Versuch, eine korpusbasierte Methode zur Lehrmaterialienerstellung für die arabische Mediensprache einzusetzen. Dafür wurden schriftliche und orale Korpora im mit dem der Routledge Frequency Dictionaries vergleichbaren Umfang von ca. 25 Millionen Wörtern aus den Zeitungen al-Quds al-ʿArabī, al-Sarq sowie al-Jazeera-Transkripten erstellt. Daraus wurde unter Zuhilfenahme von Buckwalters Arabic Morphological Analyzer und den Worthäufigkeiten in Google News ein Häufigkeitswortschatz von knapp über 3500 Lemmata extrahiert und nach Wurzeln bzw. Wortfamilien sortiert, der wie gezeigt werden konnte 95% von nicht-trivialen zeitgenössischen Medientexten deckt. Um dem Charakter der Mediensprache gerecht zu werden, wurden Neologismen (Wortlänge, Wortformen) sowie multi word items (N-Gramm Suche, Kollokationen) eigens behandelt und verschiedenen Themenbereichen zugeordnet als auch ein diskursives Konversations- und Moderationsvokabular erarbeitet. Auf Grund seiner Güte lässt sich diese Unterlage besonders in Lektürekursen nach einem Grundkurs einsetzen, in denen Studenten verschiedener Niveaus und Vorbildung zusammenkommen, um Unterschiede im Vokabular auszugleichen. Ebenso könnten Lernende Konkordanzen gewisser Wörter und Wortverbindungen erstellen, welche der Vokabelakquisition eine explorative Dimension verleihen bzw. dem idiomatischen Feinschliff bei der Textproduktion dienen.
Recently, counting the number of publications that are marketed as Arabic courses takes a long time. However, if one takes a look at them, one must consider most of them elementary courses starting with the Arabic alphabet and providing a grammar for beginners. The by-product of such works is a vocabulary for the comprehension of text excerpts that seem to have been chosen not infrequently as manifestations of certain syntactic phenomena. Textbooks for advanced students are usually chrestomathies, which rarely go beyond Text and Glossary, where existing media files mostly need to be taken as texts read aloud. In the case of Media Arabic, which is being integrated into university curricula (e.g. Leeds, Edinburgh, Vienna) not least because of the popularity of the satellite station al-Jazeera and the modern need to reflect the Arab perspective, if there are any textbooks available, they are proprietary and tailored to the home institution of the author, restricting their use in terms of knowledge and year of learning. Moreover, the problem of Oral Media Arabic - due to the Arabic multiglossia - has hardly found any mention so far. Thge present work is understood as an attempt to set up a corpus-based method to prepare teaching materials for Media Arabic. Therefore corpora totaling approximately 25 million words were compiled from which a frequency vocabulary of just over 3.500 lemmas was extracted and sorted by roots respectively word families and word forms, which was found to cover 95% of contemporary non-trivial media texts. To meet the character of the language of the media, multi word items were treated specially and assigned to different areas, and a vocabulary for conversation and moderation was developed. Because of its performance, the material can be used especially in reading courses after a basic course that bring together students of different levels and educational backgrounds to offset differences in the vocabulary. Learners could also create concordances based on the compiled material in order to acquire vocabulary and collocations in an explorative manner and correct written texts idiomatically.
