284 65 2MB
English Pages [169] Year 2003
Êîìïüþòåðíûå òåõíîëîãèè â èçó÷åíèè èíîñòðàííûõ ÿçûêîâ
Êóðñ ëåêöèé
Êðàñíîÿðñê ÑÔÓ 2011
УДК 372.8:802.0 (07) Б43 Белецкий С. Б. Б43 Компьютерные технологии в изучении иностранных языков [Электронный ресурс] : курс лекций / авт. канд. фил.наук С. Б. Белецкий ; разраб. : Центр обучающих систем ИнТК СФУ. – Версия 1.0. – Электрон.дан. (3 Мб). – Красноярск : СФУ, 2011. – 1 электрон.опт. диск (CD). – Систем. требования : IntelPentium (или аналогичный процессор других производителей) 1 ГГц ; 512 Мб оперативной памяти ; 50 Мб свободного дискового пространства ; привод CD ; операционная система MicrosoftWindows XP / Vista/ 7. – № гос. регистрации 0321103108. ISBN978-5-7638-2457-5
Курс лекций знакомит с проблематикой медиализации изучения иностранных языков в частности с компьютерными средствами и технологиями изучения и преподавания иностранных языков. В рамках курса рассматриваются как общетеоретические основания преподавания языков с помощью компьютера так и отдельные конкретные технологии и состоит из следующих разделов: введение в медиаобразование; информационные технологии и программные средства изучения и исследования язык; компьютерно-опосредованный перевод как форма изучения иностранного языка. Предназначен для студентов обучающихся на отделениях иностранных языков, а так же студентов специализирующихся в области прикладной лингвистики и методики преподавания иностранных языков.
ISBN978-5-7638-2457-5
© С. Б. Белецкий,2011 © Разработка и оформление электронного образовательного ресурса: Центр обучающих систем Информационнотелекоммуникационного комплекса СФУ, 2011 © Сибирский федеральный университет, 2011
Содержимое ресурса охраняется законом об авторском праве. Несанкционированное копирование и использование данного продукта запрещается. Встречающиеся названия программного обеспечения, изделий, устройств или систем могут являться зарегистрированными товарными знаками тех или иных фирм.
Подписано к использованию 01.09.2011 Объем 3Мб. Заказ № 5217 Сибирский федеральный университет, 660041, г. Красноярск, пр. Свободный, 82а
Оглавление Лекция 1. Медийность действительности и медиаобразования Лекция 2. Усвоение языка и медиа Лекция 3. Компьютерно-опосредованное изучение иностранных языков Лекция 4. Веб и компьютерно-опосредственная коммуникация в изучении иностранных языков Лекция 5. Технологии распознавания естественного языка в изучении иностранных языков Лекция 6. Корпусная лингвистика как ресурс для изучения иностранных языков Лекция 7. Машинный перевод как ресурс для изучения иностранных языков Лекция 8. Информационный поиск и системы мониторинга контента Список использованной литературы
Компьютерные технологии в_____________________________________________________________________ изучении иностранных языков Лекционно-семинарский курс ЛЕКЦИЯ 1. Медийность действительности и медиаобразование
ИФиЯК СФУ Вес. семестр ’11 С.Б. Белецкий
Знакомство Станислав Борисович Белецкий Каб. 3-30 – Центр испанского языка Консультации: ср. 13.35 – 14.10 (большая перемена) и по договоренности [email protected] Лекции в пдф на www.study.sfu-kras.ru compstudy
2
Экзамен Регулярное посещение лекций и семинаров Активная работа на семинарах Контрольная При необходимости возможны особые условия сдачи экзамена для иностранных студентов.
3
Введение Зачем изучать изучение иностранных языков с использованием компьютерных технологий?
4
Медиализация
Медиализация – восприятие действительности (и отчасти ее сотворение) через средства массовой коммуникации, или (масс-)медиа.
« медиа становятся основной формой репрезентации опыта для подавляющего большинства населения планеты. Мир начинает выглядеть не таким, каким он реально является, а таким, каким подают его СМИ» (Черных, 2007: 191-192).
описание / текстуализация визуализация озвучание театрализация экранизация
СОБЫТИЙ
5
Медиа
от лат. medium «посредник» = каналы и средства сохранения и передачи информации Телефон Телевидение Радио Телеграф Компьютер Интернет Газеты Журналы …
Если речь идет о массовом информировании, то используется термин «масс-медиа». 6
Медиа Телефон Телевидение Радио Телеграф Компьютер Интернет
Аналоговые Электронные Дигитальные
Газеты Журналы Альманахи
требуют применения тех. средств МЕДИА
Печатные
СМИ (периодичность!)
7
Медиа компакт-диски
театр
слова
лекция числа
деньги
кассеты
одежда
фотография
жилище
бумага
автомобиль
игры Медиа – внешние расширения человека. Артефакты = средства коммуникации.
8
The Medium is the Message
Герберт Маршалл Маклюэн / Herbert Marshall McLuhan (21.07.1911 – 31.12.1980) – канадский ученый, исследователь влияния средств коммуникации на общество. Показал важность изучения медиа самих по себе, вне зависимости от содержания передаваемой по ним информации. Assumption College in Windsor, Ontario, St. Michael's College of the University of Toronto Основные работы: Механическая невеста: Фольклор индустриального человека (1951) / The Mechanical Bride: Folklore of Industrial Man Галактика Гутенберга: Становление человека печатающего (1962) / The Gutenberg Galaxy: The Making of Typographic Man Понимание медиа: Внешние расширения человека (1964) / Understanding Media: The Extensions of Man
9
The Medium is the Message
«Использование любого средства коммуникации, или расширения человека, меняет не только пропорции между нашими органами чувств, но и формы (patterns) взаимозависимости между людьми (Маклюэн, 2003: 101)».
Горячие vs. холодные средства коммуникации Горячее средство расширяет восприятие через один-единственный канал до высокой степени определенности (фотография vs. комикс). Холодное средство предоставляет скудную информацию одному из каналов восприятия (телефон vs. радио).
10
The Medium is the Message Пример разрушительного воздействия горячей технологии, приходящей на смену холодной, приводит Роберт Тиболд в книге «Богатые и бедные». Когда австралийские аборигены получили от миссионеров стальные топоры, их культура, базирующаяся на каменном топоре, потерпела катастрофу. Каменный топор был не просто редкостью; он всегда служил основным статусным символом, подчеркивающим значимость мужчины. Миссионеры привезли с собой кучу острых стальных топоров и раздали их женщинам и детям. Мужчинам даже приходилось брать их у женщин взаймы, и это вызвало катастрофическое падение мужского достоинства. Племенная и феодальная иерархия традиционного типа быстро разрушается при столкновении с любым горячим средством коммуникации Такие средства, как деньги, колесо, письмо или любая другая форма специалистского ускорения обмена и движения информации, приводят к фрагментации племенной структуры (Маклюэн, 2003: 29).
11
The Medium is the Message Этапы развития цивилизации по М. Маклюэну:
первобытная устная культура с коллективным восприятием и пониманием мира; письменно-печатная культура, характеризующаяся деколлективизацией и индивидуализмом; «глобальная деревня» и возврат к коллективности и многомерному (аудиовизуальному) восприятию мира через электронные средства общения.
12
The Medium is the Message
Направления изучение медиа: медиалогия; связи с общественностью; теория массовой коммуникации; компьютерно-опосредованная коммуникация; новые медиа; …; медиапедагогика / медиаобразование.
13
Медиаобразование
Медиаобразование – направление в педагогике, выступающее за изучение «закономерностей массовой коммуникации (прессы, телевидения, радио, кино, видео и т.д.). Основные задачи медиаобразования: подготовить новое поколение к жизни в современных информационных условиях, к восприятию различной информации, научить человека понимать ее, осознавать последствия ее воздействия на психику, овладевать способами общения с помощью технических средств» (Российская педагогическая энциклопедия, 1993: 555).
Медиаграмотность – умение создавать, анализировать и интерпретировать медиатексты.
Definitions of media texts have moved far away from the traditional view of text as words printed in ink on pieces of paper to take on a far broader definition to include speech, music and sound effects, image and so on… Media texts, then, reflect the technology that is available for producing them… (Bell, 1996: 3) 14
Медиаобразование
Каким может стать преподавание и изучение языков, если мы будем использовать ИТ?
Проведите аналогию!
Wolfram, C. Teaching kids real math with computers. URL:
http://www.ted.com/talks/conrad_wolfram_teaching_kids_real_math_with_co mputers.html
15
Медиаобразование
Схема анализа медиа «Tetrad»
Что интенсифицирует медиа? Картинка, звук, слово – мультимодальное восприятие
На что способно его крайнее проявление?
Симуляция действительности???
ПК + Интернет
Интерактивность Что из ушедшего медиа оживляет?
ТВ, радио, пресса Популярность каких других медиа он уменьшает?
16
Литература
Добросклонская, Т.Г. Вопросы изучения медиатекстов. Опыт исследования современной английской медиаречи. М., 2005. клюэн, М. Понимание медиа: внешние расширения человека. Пер. с англ. В.Н. Николаева. Москва-Жуковский: Канон-Пресс-Ц, 2003. Медиа. Введение / Под ред. А Бриггза, П. Кобли / Пер. с англ. Ю.В. Никулевича. 2-е изд. М.: ЮНИТИ-ДАНА, 2005. Черных, А. Мир современных медиа. М.: изд. дом «Территория будущего», 2007. Российская педагогическая энциклопедия. М., 1993. – Т. 1. Bell, A. Approaches to Media Discourse. 1996. Wolfram, C. Teaching kids real math with computers. URL: http://www.ted.com/talks/conrad_wolfram_teaching_kids_real_math_with_comp uters.html.
17
Компьютерные технологии в_____________________________________________________________________ изучении иностранных языков Лекционно-семинарский курс ЛЕКЦИЯ 2. Усвоение языка и медиа
ИФиЯК СФУ Вес. семестр ’11 С.Б. Белецкий
Усвоение языка родной язык = усвоенный в детстве иностранный язык = выученный/изучаемый
хронология
первый язык второй язык
= родной = иностранный
родной язык первый язык
= язык своей этнич. группы = гос. язык, лингва франка самоидентификация
внешняя оценка
второй язык = язык повседневного общения иностранный язык = язык, изучаемый вне функциональность лингвокультурного сообщества
19
Усвоение языка усвоение Я1 vs. усвоение Я2
Я1 быстро
Я2 скорость усвоения медленно этапы в принципе одни и те же важность исправления не влияет на метод усвоения ошибок усвоение уровень усвоения больше чем «сумма услышанного» эффективность всегда высокая не всегда высокая
20
Усвоение языка Теории усвоения языка (language acquisition) Как детям удается выучить язык, получая минимум информации о том, как он устроен? vs. Теории усвоения второго (третьего, четвертого…) языка (second language acquisition) Как изучающий язык его изучает? А НЕ как учитель его преподает? vs. Биллингвизм (мультилингвизм) Изучение конечного результата процесса усвоения двух (и более) языков
21
Усвоение языка Теории усвоения языка (language acquisition) Как детям удается выучить язык, получая минимум информации о том, как он устроен? vs. Теории усвоения второго (третьего, четвертого…) языка (second language acquisition) Как изучающий язык его изучает? А НЕ как учитель его преподает? vs. Биллингвизм (мультилингвизм) Изучение конечного результата процесса усвоения двух (и более) языков
22
Усвоение языка Теории усвоения языка: социальный интеракционизм; relational frame theory; эмергентизм (MacWhinney's competition model); универсальная грамматика (генеративная грамматика); эмпирицизм …
23
Усвоение языка Теории усвоения языка: социальный интеракционизм; relational frame theory; эмергентизм (MacWhinney's competition model); универсальная грамматика (генеративная грамматика); эмпирицизм …
24
Генеративная грамматика Аврам Ноам Хомский / Avram Noam Chomsky (07.12.1928) – американский лингвист и политический публицист, автор концепции генеративной грамматики. Профессор Массачусетского технологического института, докторскую степень получил в Университете Пенсильвании. Основные работы: Синтаксические структуры / Syntactic Structures (1957) Теория принципов и параметров / Principles and Parameters Theory (1993, совместно с H. Lasnik) Минималистская программа / The Minimalist Program (1995)
25
Генеративная грамматика Центральным положением генеративной грамматики является идея врожденной языковой способности – заложенного на генетическом уровне знания о языке, или механизма усвоения языка (language acquisition device). Задача генеративной грамматики – дать формальное описание этой способности, т.е. создать универсальную грамматику, присущую всем языкам мира. Свидетельства существования универсальной грамматики: языковые универсалии; высокая скорость усвоения языка детьми; «бедность стимула». Способ описания – трансформационная порождающая грамматика (синтаксис!). 26
Генеративная грамматика Генеративная грамматика: любую грамматическую систему можно представить в качестве одной из вариаций реализации принципов универсальной грамматики.
27
Генеративная грамматика Analytical Triplet
Trigger
Primer input языковые данные
Universal Grammar
Genotype ядерные предложения + правила трансформаций
Individual Grammar
Phenotype «настройки» языка
28
Генеративная грамматика
«… язык L есть множество (конечное или бесконечное) предложений, каждое из которых имеет конечную длину и построено с помощью операции соединения из конечного множества элементов» (Хомский/Миллер, 2003: 18).
«Под грамматикой понимается набор правил, которые (в частности) рекурсивно перечисляют предложения языка» (там же: 19).
Основные компоненты грамматики: фонетика, морфология, синтаксис, семантика. Описываются с точки зрения синтаксической организации.
29
Генеративная грамматика
Фонетический компонент содержит правила построения цепочки фонетических символов и их интерпретации. Слоговая организация слова подчиняется универсальному принципу Maximal Onset Principle.
30
Генеративная грамматика
Maximal Onset Principle δ1 / \ O R | N | C V | | /d i d i
ε δ2 O
R | N
/ \ C C V V | | | | p l ə u p l o
δ3 / \ O R | N | C V | | m ə/ m a
31
Генеративная грамматика Проверьте универсальный принцип слоговой организации – проанализируйте слоговую структуру :
o
p
e
n
i
n
g 32
Генеративная грамматика
Синтаксис: поверхностная структура = грамматичные предложения языка; глубинная структура = прототипы предложений. They are flying planes. [They [are [flying planes]]].
[They [[are flying] planes]].
Поверхностная структура выводится из глубинной путем применения особых правил перестройки – трансформаций.
33
Генеративная грамматика
Главное правило – разложение предложения на именные и глагольные группы:
S => NP + VP
и далее до появления в правой части дерева непосредственных составляющих терминальных (более не разлагаемых) символов – символов частей речи (N, V, Adj, P, C, D) и вспомогательных компонентов (I, Vaux, X`).
34
Генеративная грамматика
[They [are [flying planes]]]. S1 NP VP | N V NP | | They are NP S2 | N planes | planes
fly
(= planes that fly)
[They [[are flying] planes]]. S1 NP VP | N aux VP | | They tense V NP | | pr.cont. N | fly planes
35
Генеративная грамматика
[They [are [flying planes]]]. S1 NP VP | N V NP | | They are NP S2 | N planes | planes
fly
(= planes that fly)
[They [[are flying] planes]]. S1 NP VP | N aux VP | | They tense V NP | | pr.cont. N | fly planes
36
Генеративная грамматика
Основные виды трансформаций: отрицательная трансформация; вопросительная трансформация; трансформация пассивизации; трансформация номинализации; трансформация релятивизации; трансформация опущения кореферентных именных групп; трансформация подъема элемента из структуры …
37
Генеративная грамматика
Морфологический компонент содержит правила создания и интерпретации морфологических единств.
38
Генеративная грамматика
Семантический компонент содержит правила лексической сочетаемости слов. Представляет собой «ментальный лексикон».
Ментальный лексикон Фонетическая форма Синт. Категория + субкатегориальная инф. Семантическое значение
der /der/ D[NP_] 1X
Пример реализации одной глубинной структуры с учетом и без учета семантического компонента Es ritten heute drei Reiter zum Tor. Drei Reiter ritten *es heute zum Tor.
39
Усвоение второго языка Теории усвоения языка (language acquisition) Как детям удается выучить язык, получая минимум информации о том, как он устроен? vs. Теории усвоения второго (третьего, четвертого…) языка (second language acquisition) Как изучающий язык его изучает? А НЕ как учитель его преподает? vs. Биллингвизм (мультилингвизм) Изучение конечного результата процесса усвоения двух (и более) языков
40
Усвоение второго языка
усвоение Я1 ≠ усвоение Я2 более скромная языковая компетенция 2 «следы» Я1 в Я2 «следы» Я2 в Я1
интерязык как объект исследования интерференция гиперкоррекция упрощение (пиджинизация) этапы усвоения Я1 и Я2 (=!)
1. Plural -s 2. Progressive -ing 3. Copula forms of be 4. Auxiliary forms of be 5. Definite and indefinite articles the and a 6. Irregular past tense 7. Third person -s 8. Possessive 's
Girls go. Girls going. Girls are here. Girls are going.
The girls go. The girls went. The girl goes. The girl's book. 41
Усвоение второго языка
Теории усвоения второго языка: Anderson's Automaticity theory; Connectionism; Competition Model; Noticing Hypothesis; Long's Interaction Hypothesis; Swaine's Comprehensible Output Hypothesis; Stephen Krashen's Theory …
42
Усвоение второго языка
Теории усвоения второго языка: Anderson's Automaticity theory; Connectionism; Competition Model; Noticing Hypothesis; Long's Interaction Hypothesis; Swaine's Comprehensible Output Hypothesis; Stephen Krashen's Theory …
43
Усвоение второго языка
Krashen, S.D. Second Language Acquisition and Second Language Learning, 1981.
Как зарождается языковая способность 2? усвоение vs. изучение = осознанно vs. неосознанно
Усвоение в ходе естественной коммуникации происходит неосознанно и развивает спонтанную речь. Усвоение в ходе обучения происходит осознанно и развивает в большей степени умение находить ошибки, чем умение общаться на Я2.
44
Усвоение языка
Изучение усвоения языка в классе как направление исследований: важно понять не то, что делает/должен делать учитель (= языковое образование), а то, как его инструкции влияют на ученика.
Традиционные методики обучения языку (грамматике и лексике) не эффективны, т.к. не дают возможности использовать язык в коммуникативных целях.
стратегии обучения (напр., способы запоминания слов) vs. стратегии коммуникации (напр., приемы объяснения новых слов, lifelike conversations)
45
Усвоение языка
Подходы к обучению иностранным языкам (= представление о языке)
структуралистский функциональный интеракционистский (коммуникативный)
Методы: грамматико-переводной, аудиолингвальный метод, feedback training method метод Палмера, directed practice прямой метод, series method погружение (immersion), метод молчания, метод С. Крашена, Dogme language teaching
46
Усвоение языка
Некоторые стратегии обучения смешанное обучение (компьютерно-/веб-опосредованное) развитие коммуникативных навыков: чтение, письмо, аудирование, говорение; резюмирование, описание, рассказ… Sandwich technique Mother tongue mirroring
47
Усвоение языка
Некоторые веб-инструменты изучения иностранных языков площадки взаимообучения, специализированные социальные сети (Livemocha, Babbel) языковые порталы онлайн курсы (Longman, Huber) массовые многопользовательские онлайн-игры (World of Warcraft)
48
Литература
Хомский, Н., Миллер, Дж. Введение в формальный анализ естественных языков: Пер. с англ. М.: Едиториал УРСС, 2003. Генеративная лингвистика / ЛЭС / Гл. ред. В.Н. Ярцева. М., 1990. С. 9899. Stephen D. Krashen. Explorations in Language Acquisition and Useб 2003. Eric H. Lenneberg. On Explaining Language. Science, New Series, Vol. 164, No. 3880. (May 9, 1969), pp. 635-643. Панина, Е.М. Рационализм и эмпиризм в исследованиях лингвистических универсалий. Вестник Московского университета. Серия 7. Философия. №5, 2001. С. 18-27. http://www.philos.msu.ru/vestnik/philos/art/2001/panina_ratio.htm. Хомский, Н. Синтаксические структуры / Пер. с англ. Благовещенск: БГК, 1998.
49
Компьютерные технологии в_____________________________________________________________________ изучении иностранных языков Лекционно-семинарский курс ЛЕКЦИЯ 3. Компьютерно-опосредованное изучение иностранных языков
ИФиЯК СФУ Вес. семестр ’11 С.Б. Белецкий
CALL Компьютерно-опосредованное изучение языка (сomputer-assisted language learning / CALL) – «the search for and study of applications of the computer in language teaching and learning» (Levy: 1997, 1). Программные средства, методики обучения, стратегии изучения: обучающие программы; компьютерно-опосредованная коммуникация; виртуальные миры; мобильные приложения…
51
CALL Сomputer-assisted language learning (CALL) vs. Computer-assisted language instruction (CALI) Technology-enhanced language learning (TELL) Изменения названия концепции отражают изменение в представлении о роли ученика (от центрированности учебного процесса на учителе до его центрированности на ученике). CALL во многом ориентируется на принципы и методики преподавания языка, а также на теории усвоения языка.
52
CALL В зависимости от теоретического подхода к проблематике CALL, выделяются 3 этапа развития CALL (Warschauer , 1996): бихевиористский (1950-е – 1970-е); коммуникативный (1970-е – 1980-е); интегративный (с 1990-х).
53
CALL: бихевиористский подход Бихевиористский этап развития CALL (1950-е – 1970-е) представление об изучении языка как о постоянном повторении и заучивании главенствующий метод: drill and practice роль компьютера: тьютор (тот, кто знает правильный ответ, и оценивает) типы упражнений: заучивание слов, грамматических структур, межъязыковых соответствий пример программы: ABBYY Lingvo Tutor
54
CALL: бихевиористский подход
55
CALL: коммуникативный подход Коммуникативный этап развития CALL (1970-е – 1980-е) представление об изучении языка как о его использовании, а не анализе его единиц: “CALL uses the target language exclusively and creates an environment in which using the target language feels natural, both on and off the screen” (Warschauer, 1996: www) Коммуникативный подход к CALL приобрел популярность в связи с широким распространением персональных компьютеров. роль компьютера: тьютор стимул инструмент 56
CALL: коммуникативный подход Метод
Тьютор
Стимул
Инструмент
skill practice, but in a non-drill format
стимулирование речевой деятельности
предоставление возможности более эффективного использования языка
Упражне- paced reading, ния реконструкция текста, языковые игры
обсуждение, письмо, критическое мышление
–
Роль ученика
имеет возможность выбора вариантов ответа, методов контроля и интерактивностью
автономный деятель
–
Примеры программ
HotPotatoes
Where in the World is San Diego?
текстовые редакторы, средства автоматической проверки орфографии и пунктуации, программы верстки, конкорданции
57
CALL: коммуникативный подход Метод
Тьютор
Стимул
Инструмент
skill practice, but in a non-drill format
стимулирование речевой деятельности
предоставление возможности более эффективного использования языка
Упражне- paced reading, ния реконструкция текста, языковые игры
обсуждение, письмо, критическое мышление
–
Роль ученика
имеет возможность выбора вариантов ответа, методов контроля и интерактивностью
автономный деятель
–
Примеры программ
HotPotatoes
Where in the World is San Diego?
текстовые редакторы, средства автоматической проверки орфографии и пунктуации, программы верстки, конкорданции
58
Приложение в Facebook
59
CALL: интегративный подход Интегративный этап развития CALL (с 1990-х) Начался с появлением технологий мультимедиа/гипермедиа и интернета. Позволяет тренировать виды речевой деятельности одновременно и дает возможность ученику самостоятельно определять стратегию изучения языка. Из инструмента заучивания CALL окончательно превратился в средство обучения языку за пределами класса.
60
CALL: интегративный подход Обучающая программа «Dustin», разработанная Institute for Learning Sciences at Northwestern University + Возможность самостоятельного обучения – Дефицитарная интеракция: звучащая речь не распознается не учитываются нарушения прагматики общения
27.10.2011
61
CALL: интегративный подход CALL с привлечением технологий мультимедиа лишь отчасти является интегративным (т.е. позволяющим развивать все виды речевой деятельности), поскольку не может имитировать естественное речевое общение. Эта задача решается в рамках разработки искусственного интеллекта (Artificial intelligence / AI) и создания т.н. Intelligent CALL. На сегодняшний день субститутом естественного речевого общения в концепции CALL выступает компьютерно/вебопосредованная коммуникация.
62
CALL и мультимедиа Мультимедиа – технические средства, позволяющие объединить разнородные данные (графика, текст, звук, видео) в единую информационную среду и работать с ней в режиме диалога (напр., лазерное шоу). Гипермедиа – это гипертекст, в который включены основные составляющие мультимедиа (графика, звук, видео, текст), снабженные гиперссылками (напр., компьютерная игра). Гипертекст – набор текстов, содержащих указания на возможные переходы между ними, следуя по которым читатель самостоятельно выбирает траекторию чтения текста (напр., энциклопедия или веб-страница).
63
CALL и мультимедиа Теория мультимедийного: для наиболее эффективного обучения следует применять визуальный и вербальный материал синхронно. Ричард Мейер (Richard Meier) , профессор психологии Калифорнийского университета
Принцип модальности Принцип пространственной связи Принцип временной связи Принцип согласованности Принцип индивидуальных отличий
Пример мультимедийного проекта, который может быть использован в качестве образовательного:
http://www.nytimes.com/packages/html/nyregion/1-in-8-million/index.html
64
CALL и мультимедиа Пример мультимедийного проекта, который может быть использован в качестве образовательного
http://www.nytimes.com/packages/html/nyregion/1-in-8-million/index.html
65
CALL и мультимедиа Предыстория: граммофон, радио, кассета, диафильм, кино… 1990-е: обучающие программы на CD-ROM и DVD: Reference tools on CD-ROM CD-ROMs for young learners CD-ROMs for the secondary school CD-ROMs for university students Grammar on CD-ROMs CD-ROMs for adult learners CD-ROMs incorporating Automatic Speech Recognition (ASR) A complete course on CD-ROM A simulation on CD-ROM (Davies, 2010: Section 3.1) 2000-е: обучающие программы становятся веб-приложениями
66
CALL и мультимедиа
http://www.longman.ru/component/page,shop.product_details/flypage,shop.flypage/pr oduct_id,79/category_id,17/manufacturer_id,0/option,com_virtuemart/Itemid,27/ 67
CALL и мультимедиа
http://media.pearsoncmg.com/intl/elt/myenglishlab/organization/HowMyEnglishLabis Organized.html 68
Литература
Davies, G. Introduction to multimedia CALL. Module 2.2 in Davies G. (ed.) Information and Communications Technology for Language Teachers (ICT4LT), Slough, Thames Valley University, 2010. URL: http://www.ict4lt.org/en/en_mod2-2.htm. Levy, M. CALL: context and conceptualisation, Oxford: Oxford University Press, 1997 [Google Books]. Warschauer M. Computer-assisted language learning: an introduction. In Fotos S. (ed.) Multimedia language teaching, Tokyo: Logos International, 1996. URL: http://www.ict4lt.org/en/warschauer.htm. Обучающая программа «Dustin». http://www.engines4ed.org/hyperbook/nodes/NODE-130-pg.html. One in 8 Million. http://www.nytimes.com/packages/html/nyregion/1-in-8million/index.html
69
Компьютерные технологии в_____________________________________________________________________ изучении иностранных языков Лекционно-семинарский курс ЛЕКЦИЯ 4. Веб и компьютерно-опосредованная коммуникация в изучении иностранных языков
ИФиЯК СФУ Вес. семестр ’11 С.Б. Белецкий
CALL: интегративный подход с 1990-х Позволяет тренировать виды речевой деятельности одновременно и дает возможность ученику самостоятельно определять стратегию изучения языка. технологии мультимедиа и Интернет естественное речевое общение Intelligent CALL компьютерно/веб-опосредованная коммуникация
71
СМС: обзор Computer-mediated communication (СМС) is communication that takes place between human beings via the instrumentality of computers (Herring, 1996: 1) Общение, протекающие с использование двух и более компьютеров, объединенных в сеть. Форматы СМС: электронная почта; чат; мессенджер; sms-сообщение; форумы…
72
СМС: Интернет Сеть = соединение, объединение, совокупность компьютеров: интранет интернет Internet – a global computer network providing a variety of information and communication facilities, consisting of interconnected networks using standardized communication (Oxford English Dictionary) protocols. The medium is the message. сеть vs. компьютер
73
СМС: Интернет
Схема анализа медиа «Tetrad» (М. Маклюэн)
Что интенсифицирует медиа?
Что из ушедшего медиа оживляет?
На что способно его крайнее проявление?
Популярность каких других медиа он уменьшает?
74
СМС: Интернет
The History of the Internet. URL: http://www.youtube.com/user/mysmartvideos#p/search/0/MbMAPoga8tE 1969 ARPANET 1972 e-mail 1972 TCP 1983 DNS 1988 Morris 1989 WWW (http, html) 1993 Mosaic 1995 Amazon.com 1998 Google Inc. 2002 500 млн. пользователей 2004 Facebook 2005 YouTube 2008 1,5 млрд. пользователей
75
СМС: Интернет
Схема анализа медиа «Tetrad» (М. Маклюэн) Что интенсифицирует медиа?
мультимодальность
На что способно его крайнее проявление? Симуляция действительности???
Сеть Интерактивность
Что из ушедшего медиа оживляет?
Компьютер
Популярность каких других медиа он уменьшает?
76
СМС Internet – a global computer network providing a variety of information and communication facilities, consisting of interconnected networks using standardized communication protocols. (Oxford English Dictionary) веб передача данных частные электронная почта HTTP научные TCP/IP коммерческие IP-телефония видеоконференци IP-TV… блоги факс телефон…
77
СМС: Computer-mediated Discourse В чем отличительная особенность общения в эл. среде? Чем оно отличается от обычного общения face-to-face? Computer-mediated Discourse weblish, netlingo, e-talk, tech-speak, wired-style, geek-speak, netspeak языковые формы коммуникативные практики
78
СМС: Computer-mediated Discourse Одна из главных особенностей СМС – исчезновение телесности
(McQuail, 2005: 552) 79
СМС: Computer-mediated Discourse Язык социальной близости / отдаленности П. Кох, В. Остеррайхер (Koch, 1990) Исследовали характер взаимоотношений между средствами реализации высказывания / текста и его стилистической оформленностью. Средства реализации речи – устная и письменная – представляют собой дихотомию, в то время как стилевой регистр предстает континуумом, крайними полюсами которого являются разговорная и литературная формы языка.
80
СМС: Computer-mediated Discourse d) журнальное интервью e) запись в дневнике f) частное письмо j) статья в научном журнале k) нормативный документ
Разговорный язык
Письменная речь Устная речь
Литературный язык а) задушевная беседа в) тел. разговор с другом с) интервью g) собеседование i) доклад
81
СМС: Computer-mediated Discourse
Устная vs. письменная речь в сетевом преломлении К. Дюршайдт. Медиально-опосредованная коммуникация (Dürscheid, 2003) Средства коммуникации
Факс, автоответчик, компьютер с сетью,
моб. телефон
Формы коммуникации
Факс, сообщение автоответчика, сообщение эл. почты / чата / мессенджера тел. разговор, смс-сообщение
82
СМС: Computer-mediated Discourse Устная vs. письменная речь в сетевом преломлении К. Дюршайдт. Медиально-опосредованная коммуникация общее ком. пространство нет общего ком. пр-ства синхронная квазисинхронная асинхронная к о м м у н и к а ц и я
Растяжение коммуникативной ситуации 83
СМС: Computer-mediated Discourse Устная vs. письменная речь в сетевом преломлении К. Дюршайдт. Медиально-опосредованная коммуникация Разговорный язык
Литературный язык
Устная речь Письменная речь
D – дискурс, Т – текст
84
Компьютерно-опосредованная коммуникация Важно помнить, что при использовании технологий дистанционного обучения язык социальной отдаленности «трансформируется» в язык социальной близости.
85
* Stanislav Beletskiy [Mon, 31 Jan 2011 13:44:11 +0700]: > Алексей, на сайте Промта в разделе часто задаваемых вопросов я нашел > комментарий по поводу этой ошибки. В качестве решения предлагается > переустановить программу с лицензионных дисков. Это возможно? Диски > сохранились? …………………. > Здравствуйте, Станислав. > > По Промту: Возможно данная ошибка связана с тем, что на другой рабочей > станции введен этот же серийный номер, поскольку в 2008 году при > установке > части машин, часть номеров была задействована. Попробуйте > воспользоваться > другим номером, например, из нижней части таблицы. В случае повторения > ошибки, рекомендую обратиться в службу поддержки Промт, поскольку СФУ > законный обладатель продукта и Вы ничего не нарушаете. > По Контексту: номер на все 53 ПК действительно единый. Честно говоря, не > помню в деталях процесс регистрации, может быть теперь небходимо > отправить > письмо с регданными. Раз просит - советую отправить и дождаться ответа > от > службы поддержки. Проблем быть не должно, ключи верные. > Диски канули вместе с серийными номерами. Правда есть образ, сделанный с оригинального диска (это не тоже самое, что простая копия). Мы пробовали - вроде ставится без всяких ошибок. Могу предложить Вам попробовать устанавливать с этого образа. Файл весит около 800 мб. Можно где-нибудь пересечься и я Вам передам DVD с образом, ну или к нам приезжайте с носителем - запишем! 86
* Stanislav Beletskiy [Mon, 31 Jan 2011 13:44:11 +0700]: > Алексей, на сайте Промта в разделе часто задаваемых вопросов я нашел > комментарий по поводу этой ошибки. В качестве решения предлагается > переустановить программу с лицензионных дисков. Это возможно? Диски > сохранились? …………………. > Здравствуйте, Станислав. > Правда / тоже самое, что > По Промту: Возможно данная ошибка связана с тем, что на другой рабочей > станции введен этот же серийный номер, поскольку в 2008 году при Диски канули вместе с > установке серийными номерами. > части машин, часть номеров была задействована. Попробуйте Можно где-нибудь пересечься > воспользоваться > другим номером, например, из нижней части таблицы. В случае повторения > ошибки, рекомендую обратиться в службу поддержки Промт, поскольку СФУ > законный обладатель продукта и Вы ничего не нарушаете. > По Контексту: номер на все 53 ПК действительно единый. Честно говоря, не Файл весит около 800 мб. > помню в деталях процесс регистрации, может быть теперь небходимо ну или к нам приезжайте > отправить > письмо с регданными. Раз просит - советую отправить и дождаться ответа > от > службы поддержки. Проблем быть не должно, ключи верные. > Диски канули вместе с серийными номерами. Правда есть образ, сделанный с оригинального диска (это не тоже самое, что простая копия). Мы пробовали - вроде ставится без всяких ошибок. Могу предложить Вам попробовать устанавливать с этого образа. Файл весит около 800 мб. Можно где-нибудь пересечься и я Вам передам DVD с образом, ну или к нам приезжайте с носителем - запишем! 87
Компьютерно-опосредованная коммуникация Возможности применения СМС в изучении языка Беспрепятственное общение с носителями языка Беспрепятственное общение с преподавателем и другими студентами Коллективная работа над заданиями Информационный поиск в аутентичной лингвистической среде (аудио, видео, газеты, рецензии на книжные новинки…) Публикация результатов деятельности для оценки профессиональным сообществом
88
Литература
Bollendorff, S., Ségrétin, A. Journey To The End Of Coal. [Web documentary]: http://www.honkytonk.fr/index.php/webdoc/ Dürscheid, Christa. Medienkommunikation im Kontinuum von Mündlichkeit und Schriftlichkeit. Theoretische und empirische Probleme. ZfAL 38, 2003. Koch, P. Gesprochene Sprache in der Romania: Französisch, Italienisch, Spanisch. Tübingen: Niemeyer, 1990. McQuail, D. Mcquail's Mass Communication Theory. 5th ed [Google Book]. London: SAGE Publications, 2005. The History of the Internet. URL: http://www.youtube.com/user/mysmartvideos#p/search/0/MbMAPoga8tE Thurlow, C., Lengel, L. & Tomic, A. Computer mediated communication: Social interaction and the internet [Google Book]. London: Sage, 2004. Tim Berners-Lee on the next Web. URL: http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html. Warschauer M. Computer-assisted language learning: an introduction. In Fotos S. (ed.) Multimedia language teaching, Tokyo: Logos International, 1996. URL: http://www.ict4lt.org/en/warschauer.htm Как закалялся Интернет. Ключевые вехи развития. http://www.3dnews.ru/news/kak_zakalyalsya_internet_kluchevie_vehi_razvitiya/ 89
Компьютерные технологии в_____________________________________________________________________ изучении иностранных языков Лекционно-семинарский курс ЛЕКЦИЯ 5. Технологии распознавания естественного языка в изучении иностранных языков
ИФиЯК СФУ Вес. семестр ’11 С.Б. Белецкий
Повторение: CALL Интегративный этап развития CALL (с 1990-х) CALL с привлечением технологий мультимедиа лишь отчасти является интегративным (т.е. позволяющим развивать все виды речевой деятельности), поскольку не может имитировать естественное речевое общение. Эта задача решается в рамках разработки искусственного интеллекта (Artificial intelligence / AI) и создания т.н. Intelligent CALL. На сегодняшний день субститутом естественного речевого общения в концепции CALL выступает компьютерно/вебопосредованная коммуникация.
91
Повторение: СМС Computer-mediated communication (СМС) is communication that takes place between human beings via the instrumentality of computers (Herring, 1996: 1) Форматы СМС: электронная почта; чат; мессенджер; sms-сообщение; форумы…
92
HCI Intelligent CALL vs CMC in CALL человек-компьютер vs человек-человек Искусственный интеллект (Artificial intelligence / AI) – аппаратное / программное моделирование интеллектуальных / творческих видов человеческой деятельности, в том числе общения.
93
HCI Человеко-компьютерное общение (human-computer interaction / HCI) – разработка и внедрение интерактивных компьютерных систем и технологий. Изучение роли компьютера в HCI: компьютерная графика, операционные системы, языки программирования и др. Изучение роли человека в HCI: теория коммуникации, лингвистика, социология, когнитивная психология и др. Пользовательский интерфейс – место взаимодействия: инструменты и технологии (монитор, клавиатура, мышь…).
94
HCI Дружественный пользовательский интерфейс интуитивно понятный интерфейс имитация общения человека с человеком Интеллектуальная среда (Intelligent Environments) – пространства взаимодействия человека и компьютера в реальном мире, где очевидность общения с компьютером стирается (напр., автомат по продаже кофе). Минкер В. Интеллектуальная технология автоматического распознавания речи http://tube.sfu-kras.ru/video/789
95
HCI Технология должна «понимать» в какой среде она находится; планировать действия и преследовать цели; вести естественный диалог с пользователем; обладать свойствами межличностной коммуникации: индивидуальность; ассистент; адаптивность; доступность; кооперативность; доверие.
96
HCI Как происходит общение между машиной и человеком? Машине нужна формализованная информация. Каким образом ее можно получить и проверить правильность ее «понимания»?
97
HCI
98
HCI
Распознавание речи – преобразование речи в текст: 1) отделение звуков речи от постороннего шума; 2) сопоставление с данными из базы данных; 3) извлечение из звуков речи последовательностей акустических характеристик (= слов).
Лингвистический анализ – извлечение семантического содержания путем сопоставления комбинаций слов и данных из базы данных. Голосовой интерфейс: голосовой набор; управление бытовыми приборами; ввод данных и мн. др. 99
HCI
МТС – голосовой поиск. http://www.youtube.com/watch?v=Ql0RiVe-YFM
100
HCI
МТС – голосовой поиск. http://www.youtube.com/watch?v=Ql0RiVe-YFM
01 М: 02 Ж: 03 04 05 Ж: 06
[((реплика диктора)) ] [((устройство прокладывает путь на карте))] спасИ:бо ((реплика диктора))
101
HCI Управление диалогом Необходимо, если системе требуется дополнительная информация от пользователя (напр., время отправления поезда). 2 стратегии получения информации: анализ предыдущих высказываний (напр., шла ли речь о времени суток?); запрос информации.
102
HCI
103
HCI Синтез речи – искусственное озвучивание текста. Параметрический синтез Компиляционный синтез Полный синтез речи по правилам
104
HCI Художественная интерпретация технологий искусственного интеллекта и в первую очередь синтеза речи нашла отражение во многих фантастических / футуристических фильмах. Технологии искусственного интеллекта воспринимаются как технологии будущего. http://www.youtube.com/watch?v=sqS83f -NUww&feature=related 105
HCI Однако подобные технологии, имитирующие человеческое общение между машиной и человеком, уже широко используются, в т.ч. и в сфере преподавания языков.
http://dayone.fluenz.com/spanish/ 106
Литература
EMG-basierte Spracherkennung. URL: http://csl.ira.uka.de/index.php?id=146&L=1/ Голосовой поиск Google. URL: http://www.youtube.com/watch?v=WlULEvG87gM Минкер В. Интеллектуальная технология автоматического распознавания речи [Видеозапись лекции]. URL: http://tube.sfu-kras.ru/video/789 Распознавание речи. URL: http://chernykh.net/content/view/146/ Зубов, А.В., Зубова, И.И. Информационные технологии в лингвистике. М.: Academia, 2004.
107
Компьютерные технологии в_____________________________________________________________________ изучении иностранных языков Лекционно-семинарский курс ЛЕКЦИЯ 6. Корпусная лингвистика как ресурс для изучения иностранных языков
ИФиЯК СФУ Вес. семестр ’11 С.Б. Белецкий
Повторение: генеративная лингвистика Генеративная лингвистика – изучение грамматичных, т.е. грамматически правильно построенных, предложений. Competence vs performance Грамматичные предложение vs употребление языка в естественных контекстах
109
Корпусная лингвистика: корпус Корпус – коллекция текстов, отобранных по определенному критерию, упорядоченных по определенному признаку и снабженных механизмом поиска. Преимущества корпуса: реальный контекст употребления представительность данных возможность многократного использования для различных исследовательских задач Виды корпусов: представительные (национальные) корпусы-коллекции 110
Корпусная лингвистика: история Брауновский корпус / Brown Corpus 1960-е, Henry Kucera, W. Nelson Francis, Brown University коллекция текстов 1 млн. словоупотреблений American Heritage Dictionary (1969) … Corpus of Contemporary American English, British National Corpus, International Corpus of English 100 млн. словоупотреблений Частотный словарь русского языка Засориной, Национальный корпус русского языка
111
Корпусная лингвистика: корпус русского языка Национальный корпус русского языка работы по созданию начались в 2001 г. открылся для пользователей в 2004 г. 149 млн. словоупотреблений http://ruscorpora.ru/ составители: Институт русского языка Институт языкознания РАН Институт лингвистических исследований РАН … Яндекс
112
Корпусная лингвистика: корпус русского языка Национальный корпус русского языка охватывает период от сер. 18 до нач. 21 вв. в разных социолингвистических вариантах – литературном, разговорном, просторечном, отчасти диалектном: оригинальные (непереводные) произведения художественной литературы (проза, драматургия, поэзия); нехудожественная литература: мемуары, эссеистика, публицистика, научно-популярная и научная литература, публичные выступления, частная переписка, дневники, документы и т. п.
113
Корпусная лингвистика: корпус русского языка Национальный корпус русского языка Основные характеристики: представительность (сбалансированный состав текстов): содержит все типы письменных и устных текстов, представленные в языке (художественные разных жанров, публицистические, учебные, научные, деловые, разговорные, диалектные и т.п.); разметка: дополнительная информация о лингвистических особенностях текста (ударения, грамматические классы, границы слов и словоосочетаний и т. п.). Наличие глубокой разметки отличает корпус от простых коллекций текстов.
114
Корпусная лингвистика: корпус русского языка Национальный корпус русского языка Функции: материал для научного исследования лексики и грамматики языка справочник ресурс для преподавания языка в качестве родного или иностранного основа словаря
115
Корпусная лингвистика
116
Корпусная лингвистика Вся правда о великом и могучем. http://www.ntv.ru/novosti/211244/
117
Корпусная лингвистика Вся правда о великом и могучем. http://www.ntv.ru/novosti/211244/ Характеристики устной речи: аутентичный материал: как раз такие фразочки собственные категории: выяснилось что не обязательно употреблять что-то значащие слова ( сигналы и маркеры) иные способы связности: репертуар Элочки-людоедки (кондициональная релевантность) мультимодальность: первое существительное на 40-м месте грамматика «эмергентна»: фрагмент монолога, как говорят, образованного фотографа спонтанность речи в противовес нормативности языка: нормальный речевой портрет 118
Корпусная лингвистика: КА conversational analysis разговорная речь (talk-in-interaction) возник в 1960-70-х гг. в русле этнометодологии в США:
Harold Garfinkel Harvey Sacks Emanuel Schegloff Gail Jefferson
119
Корпусная лингвистика: КА «“Онтологическим допущением“ этнометодологии является представление о конституитивном характере социальной реальности как о продукте повседневных взаимодействий и интерпретаций… ее методологическим императивом является воздержание от привнесения в исследуемую ситуацию «посторонних» социальных значений…» «…этнометодологу надлежит сформулировать содержание того неявного знания, которое делает его [понимание] возможным.»
Смирнова М.Н. Социальная феноменология в изучении современного общества. М.: «Канон+» РООИ «Реабилитация», 2009. С. 295-297. 120
Корпусная лингвистика: КА Breaching experiments A game of tic-tac-toe where the experimenter would ask the subject to make the first move, then would erase that mark and move it to another square before making the responding move. “[S]tanding very, very close to a person while otherwise maintaining an innocuous conversation… saying ‘hello’ at the termination of a conversation.” “Another of the procedures Garfinkel developed was to send student experimenters into stores and restaurants where they were told to ‘mistake’ customers for salespersons and waiters…” Atkinson, J. M.,/Drew, P. Order in court: The organization of verbal interaction in juridical settings. London: Macmilla Garfinkel, 1979. 121
Корпусная лингвистика: КА Конверсационный анализ обратился к исследованию «упорядоченности социальных событий, воздействующих повторяющимися в них образцами и своими структурными свойства на организацию разговоров». Речевой вклад рассматривается в деятельностном аспекте: action vs. topicality.
122
Корпусная лингвистика: КА
Why that now?
123
Корпусная лингвистика: КА
What is being done by that?
124
Корпусная лингвистика: КА Последовательная организация – это мена коммуникативных ролей (turn-taking) структурная (композиционная) организация вербального взаимодействия организация последовательностей (sequence) / курса коммуникативных действий (sequence organization)
125
Корпусная лингвистика: КА «Физическая реальность коммуникации» может быть описана в терминах мены коммуникативных ролей (turn-taking). Речевой ход/шаг (turn) – право и возможность внесения речевого вклада в интеракцию, предоставляющиеся коммуниканту в ходе мены коммуникативных ролей. Речевой вклад (move) – содержание речевого хода. Конструкционная единица хода/реплики (turn constructional unit) – минимальная семантическая составляющая речевого вклада. turn-taking
------TCU-----------------------TCU----------------------movesize C flashlight battaries? turn A: Do you have uh.. -TCU- -TCUmove turn B: Yes sir turn A: I'll have fourmove please ---------TCU--------- --TCU-turn-taking 126
Корпусная лингвистика: КА Для описания «социальной реальности» коммуникации были введены термины последовательностей (sequence). Sequences are the vehicle for getting some activity accomplished.
A: B: A: B:
Do you have uh.. size pre-telling C flashlight battaries? Yes sir go ahead I'll have four please request ((goes to bring it)) reaction
Schegloff, E. A. Sequence Organization in Interaction. Cambridge, New York, Melbourne, Cape Town, Singapore, São Paulo: Cambridge University Press, 2007. P. 2. 127
Корпусная лингвистика: КА Парная последовательность (adjacency pair) является одним из способов организации перехода (turn) от одной смены коммуникативных ролей к другой (turn taking). приветствие вопрос-ответ: просьба осведомление… …
A: Hello. B: Hi. Susan? A: Ye:s A: Whatcha doing? B: Nothig A: Wanna drink?
128
Корпусная лингвистика: КА Признаки парных последовательностей: 2 выражения: 1 часть последовательности (FPP: first pair part) 2 часть последовательности (SPP: second pair part)
мена коммуникативных ролей непосредственное следование (adjacency) кондициональная релевантность обязательность (constraints) преферентная структура
129
Литература Atkinson, J. M., Drew, P. Order in court: The organization of verbal interaction in juridical settings. London: Macmilla Garfinkel, 1979. Bod L. Enriching Linguistics with Statistics. Amsterdam, 1995. Levinson, S.C. Pragmatik. Tübingen: Max Niemeyer Verlag, 2000. Schegloff, E. A. Sequence Organization in Interaction. Cambridge, New York, Melbourne, Cape Town, Singapore, São Paulo: Cambridge University Press, 2007. Баранов А.Н. Введение в прикладную лингвистику. М., 2003. Британский национальный корпус. URL: http://www.natcorp.ox.ac.uk/ Захаров В.П. Корпусная лингвистика. СПб., 2005. Марчук Ю.Н. Компьютерная лингвистика. М., 2007. Международная конференция «Диалог»: Компьютерная лингвистика и интеллектуальные технологии. URL: http://dialog-21.ru/ Национальный корпус русского языка . URL: http://ruscorpora.ru/ Смирнова М.Н. Социальная феноменология в изучении современного общества. М.: «Канон+» РООИ «Реабилитация», 2009. Сусов, И.П. История языкознания. М.: АСТ: Восток-Запад, 2006.
130
Компьютерные технологии в_____________________________________________________________________ изучении иностранных языков Лекционно-семинарский курс ЛЕКЦИЯ 7. Машинный перевод как ресурс для изучения иностранных языков
ИФиЯК СФУ Вес. семестр ’11 С.Б. Белецкий
Повторение: AI Intelligent CALL vs CMC in CALL человек-компьютер vs человек-человек Искусственный интеллект (Artificial intelligence / AI) – аппаратное / программное моделирование интеллектуальных / творческих видов человеческой деятельности, в том числе общения и перевода обработка естественного языка (natural language processing, NLP) – раздел компьютерной лингвистики, занимающийся разработкой системой распознавания, синтеза, автоматического анализа… речи/текста. Перевод как технология обработки естественного языка, а не как речевая / творческая деятельность 132
Перевод как технология Перевод как (компьютерная) технология: Машинный перевод (machine translation, MT) Автоматизированный перевод (machine-assisted translation, MAT)
“Machine translation is the application of computers to the translation of texts from one natural language into another “ (Hutchins, 1986: 15). ПО заменяет человека: реферативный перевод большого количества информации, качественный перевод только формализованных текстов. Автоматизированный перевод – ПО, помогающее человеку выполнить перевод.
Область исследований = машинный перевод.
133
Машинный перевод Машинный перевод – область компьютерной лингвистики, занимающаяся разработкой технологий автоматического перевода. 1947. В своем письме Норберту Винеру ам. математик Уоррен Уивер поставил задачу создания системы машинного перевода (позже обосновал принципиальную возможность создания такой системы). Язык как кодовая система (криптография) 1950. Тест Тьюринга поставил вопрос о возможности общения машины и человека на человеческом языке, тем самым поставив вопросы компьютерной обработки естественноязыковых сообщений в центр внимания кибернетики (в последствии искусственного интеллекта).
134
Машинный перевод 1954. Джорджтаунский эксперимент: система со словарем из 250 слов и грамматикой из 6 синтаксических правил осуществила перевод 49 предложений. 1954. Первый эксперимент по машинному переводу осуществлен в СССР в Институте точной механики и вычислительной техники Академии наук СССР. Нач. 1960-х г. Интерес к машинному переводу угас, финансирование проектов сократилось после обнародования доклада Специального комитета по прикладной лингвистике (ALPAC) Национальной академии наук США, в котором авторы пришли к выводу о невозможности создания система качественного перевода в ближайшем будущем. 1970-е г. Подъем интереса к МП в связи с его переосмыслением как одной из задач искусственного интеллекта. 135
Машинный перевод Современный этап развития МП: интерес в связи с необходимостью перевода огромного количества информации (преимущественно технического характера; доля худ. перевода в 1994 г. составляла 0,3%). Перевод, далекий от совершенства реферативный перевод Адекватный, но ограниченный по репертуару, перевод перевод формализованных текстов
136
Машинный перевод Процесс перевода
137
Машинный перевод Перевод как когнитивный процесс: 1) декодировка смысла исходного текста; 2) кодировка смысла средствами другого языка. 1) Интерпретация смысла через анализ, который предполагает знание грамматики, семантики, синтаксиса, идиоматики … исходного языка, а также особенностей культуры соответствующей лингво-культурной общности. 2) Для кодировки смысла переводчик должен знать те же характеристики языка перевода. Задача МП: научить машину «читать» текст также, как его читает человек, т.е. разработать технологию понимания естественного языка. 138
Машинный перевод Виды перевода: по степени эквивалентности: подстрочник; дословный перевод; вольный перевод; по объекту: литературный перевод; прагматический перевод.
139
Машинный перевод Задача МП: научить машину «читать» текст так же, как его читает человек. Пути решения: МП на основе правил; трансферный и интеръязыковой МП; словарный МП; статистический МП; МП на основе примеров.
140
Машинный перевод МП на основе правил основывается на лингвистической информации о паре языков = сопоставление и замена сходных грамматических конструкций на основе словарных соответствий разметка структур исходного текста и их калькирование на языке перевода
141
Машинный перевод
Трансферный и интеръязыковой МП репрезентация смысла исходного текста как зависимого или независимого от языковых особенностей пары языков: анализ морфологии и синтаксиса + генерирование текста на основе правил языка вывода и словарных соответствий Анализ: морфологический (разметка частей речи вкл. субкатегории: число, падеж и т.п.) лексическая категоризация (определение значения слов, вт.ч. многозначных) лексический трансфер (поиск лексических соответствий) структурный трансфер (поиск соответствий структур и перерасстановка слов) морфологическая генерация (генерация словоформ на языке перевода) Перевод репрезентации в конечный текст: поверхностные (для родственных языков) и глубинные (для неродственных языков) трансформации. 142
Машинный перевод Словарный МП подбор словарных соответствий без учета их смысловой и/или лексической сочетаемости с морфологическим анализом или без него. Дает удовлетворительные результаты при переводе каталогов, списков и т.п. неполнотекстовых высказываний.
143
Машинный перевод Статистический МП создание переводов по статистическим моделям, выводимым из анализа текстовых корпусов. = подсчет вероятности того, что фраза А на языке А является соответствием фразы Б на языке Б.
144
Машинный перевод МП на основе примеров перевод по аналогии корпусы параллельных текстов минимальные пары (= соответствия)
145
Машинный перевод Типы МП по степени вовлеченности человека в процесс перевода: высококачественный машинный (fully automatic high quality MT); машинный перевод (fully automatic translation); человеко-опосредованный машинный перевод (human-assisted MT); машиноопосредованный перевод (machine-assisted human translation); перевод, выполненный/выполняемый человеком (human translation).
146
Машинный перевод Типы МП по степени вовлеченности человека в процесс перевода
147
Машинный перевод Автоматизированный перевод (computer-aided translation, CAT) перевод с использование специализированного вспомогательного ПО: контролируемые / конфигурируемые системы МП; средства проверки орфографии и пунктуации; системы управления терминологией; словари и базы данных; инструменты поиска соответствий; конкорданции; битекст; системы управления проектами; системы переводческой памяти / памяти переводов (translation memory). 148
Машинный перевод Системы переводческой памяти база данных, содержащая сегменты перевода: словосочетания, предложения, группы предложений, которые заносятся в нее вручную переводчиком. Обычно используется как компонент системы МП, редактора текста, системы управления терминологией, словаря. Система управления переводческой памятью
149
Машинный перевод Немой интерфейс и перевод http://csl.ira.uka.de/index.php?id=146&L=1/
150
Литература
EMG-basierte Spracherkennung. URL: http://csl.ira.uka.de/index.php?id=146&L=1/ Баранов А.Н. Введение в прикладную лингвистику. М., 2003. Захаров В.П. Корпусная лингвистика. СПб., 2005. Каталог лингвистических программ и ресурсов в Cети // URL: http://www. rvb.ru/soft/catalogue/index.html Леонтьева Н.Н. Автоматическое понимание текстов: системы, модели, ресурсы. М., 2006. Марчук Ю.Н. Компьютерная лингвистика. М., 2007. ПЕРЕВОД. Онлайн Энциклопедия Кругосвет. URL: http://www.krugosvet.ru/enc/gumanitarnye_nauki/lingvistika/PEREVOD.html Российская ассоциация искусственного интеллекта // URL: http://www.raai. org/resurs/resurs.shtml?ilinks Шаляпина З.М. Автоматический перевод: эволюция и современные тенденции // Вопросы языкознания. 1996. № 2.
151
Компьютерные технологии в_____________________________________________________________________ изучении иностранных языков Лекционно-семинарский курс ЛЕКЦИЯ 8. Информационный поиск и системы мониторинга контента
ИФиЯК СФУ Вес. семестр ’11 С.Б. Белецкий
Повторение: интернет и веб Internet – a global computer network providing a variety of information and communication facilities, consisting of interconnected networks using standardized communication protocols. (Oxford English Dictionary) веб передача данных частные электронная почта HTTP научные TCP/IP коммерческие IP-телефония видеоконференци IP-TV… блоги факс телефон…
153
Повторение: интернет и веб Веб – массив (не)структурированных данных (данных вебстраниц). необходимость поиска практика и теория информационного поиска (information retrieval) Как проблема стал осознаваться в 60-х гг. 20 в. в связи с информационным взрывом. Информационно-поисковые системы (= электронные каталоги)
154
Информационный поиск Поиск по предмету запросу конкретным данным Процесс поиска: сбор обработка представление результатов
155
Информационный поиск Виды поиска: полнотекстовый по метаданным поиск изображений Методы поиска: адресный (по жестко заданным условиям = по принципу каталога) семантический (по содержанию = трансформация выражений на естественном языке в описание на языке запроса) документальный поиск (поиск целых документов, а не фрагментов) фактографический (извлечение фактов из массива документов) 156
Информационный поиск Информационный поиск как область исследований Решает проблему точного, быстрого и эффективного поиска и извлечения информации (данных, документов, фактов…) из локальных и гипертекстовых (интернет) баз данных
157
Информационный поиск Информационный поиск как область исследований Цель – удовлетворение информационного запроса пользователя: анализ естественного языка с целью формализации для поисковых нужд разработка и совершенствование языков запросов (ключевые слова, стоп-слова, суффиксы, логические операторы…) индексация источников (добавление сведений о сайте в базу данных поисковика для удобства поиска) классификация и фильтрация документов автоматическое реферирование и аннотирование
158
Информационный поиск Информационный поиск как область исследований Актуальность исследований обусловлена стремительным ростом объемов информации (в первую очередь в интернете) и становлением информационного общества.
159
Системы мониторинга контента Системы мониторинга контента – инструмент профессионального информационного поиска с целью мониторинга информационного поля: специальная база данных источников обработка и анализ разнородных данных структурирование данных
160
Семантическая паутина Tim Berners-Lee on the next Web. http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html
161
Литература
Tim Berners-Lee on the next Web. URL: http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html. Системы мониторинга и анализа СМИ. URL: http://www.newart.ru/oparin/smi_oparin.htm
162
Список использованной литературы Основная литература 1. Birkner, K., Stukenbrock, A. Die Arbeit mit Transkripten in Fortbildung, Lehre und Forschung. Mannheim: Verlag für Gesprächsforschung 2009. http://www.verlag-gespraechsforschung.de 2. Davies G. (ed.) Information and Communications Technology for Language Teachers (ICT4LT), Slough, Thames Valley University, 2010. [Online]: http://www.ict4lt.org/en/en_mod2-2.htm. 3. Stephen D. Krashen. Explorations in Language Acquisition and User, 2003. 4. Warschauer M. Computer-assisted language learning: an introduction. In Fotos S. (ed.) Multimedia language teaching, Tokyo: Logos International, 1996. [Online]: http://www.ict4lt.org/en/warschauer.htm. 5. Макклюэн, М. Понимание медиа: внешние расширения человека. Пер. с англ. В.Н. Николаева. Москва-Жуковский: Канон-Пресс-Ц, 2003. Дополнительная литература 1. Bell, A. Approaches to Media Discourse. 1996. 2. Dürscheid, C. Medienkommunikation im Kontinuum von Mündlichkeit und Schriftlichkeit. Theoretische und empirische Probleme / C. Dürscheid. // Zeitschrift für Angewandte Linguistik, 38. – Frankfurt am Main, Berlin, Bern, Bruxelles, New York, Oxford, Wien: Peter Lang Verlag, 2003. 3. Eric H. Lenneberg. On Explaining Language. Science, New Series, Vol. 164, 33 No. 3880. (May 9, 1969), pp. 635-643. 4. Levy, M. CALL: context and conceptualisation, Oxford: Oxford University Press, 1997 [Google Books]. 5. Litkowsky K.C. Computational Lexicons and Dictionaries \ www.clres.com\online-papers/ell.doc.
6. Schegloff, E.A. Sequence Organization in Interaction: A Primary in Conversational Analysis / E.A. Schegloff. – Cambridge, New York, Melbourne, Cape Town, Singapore, São Paulo: Cambridge University Press, 2007. 7. Selting, M. Gesprächsanalytisches Transkriptionssystem / M. Selting, P. Auer, B. Barden, J. Bergmann, E. Couper-Kuhlen, S. Günther, C. Meier, U. Quasthoff, P. Schlobinski, S. Uhmann // LB, 173. – 1998. – S. 91-122. 8. Teubert W., Cermakova A. Corpus Linguistics: A Short Introduction / W. Teubert, A. Cermakova. – Continuum International Publishing Group Ltd, 2007. – 153 p. 9. Андреев А.А. Введение в дистанционное обучение. М., 1997. 10. Генеративная лингвистика / ЛЭС / Гл. ред. В.Н. Ярцева. М., 1990. С. 98-99. 11. Гура В.В. Теоретические основы педагогического проектирования личностно-ориентированных электронных и образовательных ресурсов и сред. Ростов: Изд-во Южного Федерального университета, 2007. 320 с. 12. Добросклонская, Т.Г. Вопросы изучения медиатекстов. Опыт исследования современной английской медиаречи. М., 2005. 13. Интернет в гуманитарном образовании/ Под. ред. Е.С.Полат. М.: ВЛАДОС, 2001. 272 с. 14. Медиа. Введение / Под ред. А Бриггза, П. Кобли / Пер. с англ. Ю.В. Никулевича 2 е изд М ЮНИТИ ДАНА 2005.Никулевича. 2-е изд. М.: ЮНИТИ-ДАНА, 2005. 15. Медиаобразование / Под ред. Л.С. Зазнобиной. М.: МИПКРО, 1996. 80 с. 16. О. С. Кулагина. О современном состоянии машинного перевода // Математические вопросы кибернетики, вып. 3, М.: Наука, 1991, стр. 5-50. 17. Панина, Е.М. Рационализм и эмпиризм в исследованиях лингвистических универсалий. Вестник Московского университета. Серия 7. Философия. №5, 2001. С. 18-27.
18. Рассказы о сновидениях: корпусное исследование устного русского дискурса / под ред. А.А. Кибрика и В.И. Подлесской. – М: Языки славянских культур, 2009. 19. Российская педагогическая энциклопедия. М., 1993. – Т. 1. 20. Хомский, Н. Синтаксические структуры / Пер. с англ. Благовещенск: БГК, 1998. 21. Хомский, Н., Миллер, Дж. Введение в формальный анализ естественных языков: Пер. с англ. М.: Едиториал УРСС, 2003. 22. Черных, А. Мир современных медиа. М.: изд. дом «Территория будущего», 2007. 23. Якушина Е.В. Интернет в аспекте медиаобразования // Проблемы перехода к 12-летней системе обучения. М.: ИОСО РАО, 2000. С.134-139. Интернет-ресурсы 1.
«Диалог» – российская конференция по компьютерной лингвистике http://www.dialog-21.ru/conference/
2.
Altissia Language Programms http://www.altissia.com
3.
An integrated Japanese learning environment http://nihongoup.com/
4.
Archiv für gesprochenes Deutsch http://agd.ids-mannheim.de/html/bestellung.shtml
5.
Babbel learning systemhttp://www.babbel.com
6.
BBC Learning English www.bbc.co.uk\worldservice\learningenglish\index.shtml
7.
eHow online resource for life’s challenges http://www.ehow.com/english-language-education/
8.
Fluenz http://fluenz.com/
9.
Gözden Geçirilmiş Sözlü Türkçe Derlemi http://std.metu.edu.tr/
10. Grammar Explorer – a multimedia online grammar http://www.grammarexplorer.eu
11. History of the Internet http://www.youtube.com/watch?v=9hIQjrMHTv4 12. Instituto Cervantes´ Spanish Virtual Classroom ave.cervantes.es 13. Learn Spanish with Video - Talking Technology in Spanish http://www.youtube.com/user/spanishpod101 14. Livemocha online language learning community www.livemocha.com 15. One in 8 Million. http://www.nytimes.com/packages/html/nyregion/1-in-8-million/index.html 16. Rocket Languages course http://www.rocketlanguages.com 17. Tim Berners-Lee on the next Web http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html 18. Vocabulary Building Games http://www.vocabulary.co.il/ 19. Wolfram,
C.
Teaching
kids
real
math
with
computers.
http://www.ted.com/talks/conrad_wolfram_teaching_kids_real_math_with_computers.html 20. Британский национальный корпус http://www.natcorp.ox.ac.uk/ 21. Информационно-аналитическая система «Медиалогия» http://www.mlg.ru/ 22. Корпус испанского языка BRIGHAM YOUNG UNIVERSITY http://www.corpusdelespanol.org/ 23. Лекция «Интеллектуальная технология автоматического распознавания речи», Вольфганг Минкер http://tube.sfukras.ru/video/789 24. Национальный корпус русского языка http://www.ruscorpora.ru/ 25. Обучающая программа «Dustin». http://www.engines4ed.org/hyperbook/nodes/NODE-130-pg.html. 26. Один день из жизни русской речи http://www.ntv.ru/novosti/211244/ 27. Упсальский корпус http://www.slaviska.uu.se/korpus.htm