что включает в себя понятие аспот

Компьютерная поддержка лексикографических работ. Автоматические словари. Словари Lingvo

Специальные программы — базы данных, компьютерные картотеки, программы обработки текста — позволяют в автоматич. режиме формировать словарные статьи, хранить словарную info и обрабатывать ее.

Компьют. лексикогр-е прогр. делятся на 2 группы:

— программы поддержки лексикографических работ (ППЛгрР),

— автоматические словари (АС) разных типов, включающие лексикографич. базы данных.

ППЛгрР: традиционная форма фиксации словарных данных — каталожная карточка, где указывается описываемое слово, пример употребления, источник примера, автор, дополн. инфо. Комп. технологии позволяют упростить процесс сбора и хранения лексикогр. инфо, используя вместо картотеки базу данных. В отличие от обычной картотеки, записи базы данных дают возможность автоматически сортировать массив по выбранным параметрам, отбирать нужные примеры, объединять их в группы и т. д. Спец-ных лграф. баз данных нет. Но базы данных типа D-Base, ACCESS, FOX-Base, PARADOX вполне подходят.

у черта на куличках EXAMPLE

поперся к Баранову к черту на кулички

Этап поиска примеров на слово и формирование картотеки примеров. В традиц. технологии сбор примеров производится вручную и отнимает много t. Компьютерные программы дают возможность выбирать примеры на нужное слово из корпусов текстов, хранящихся в машинном формате на компьютере, в автоматич режиме. Поиск примеров на употребл слова называется построением конкордансов. Некоторые компьютерные программы построения конкордансов по желанию пользователя могут преобр. найденные контексты в записи базы данных. # DIALEX позволяет получать конкордансы как в традиц форме (в виде файла для текстового редактора), так и в формате базы данных PARADOX.

После подготовки первичного словарного материала — словарной картотеки — следует этап составления словарной статьи. Новая словарная статья вводится в базу данных. Редактирование словарных статей также происходит в базе данных. Все это сокращает время разработки словаря, ибо упрощается обработка системы отсылок, в автомат режиме происходят сортировки (в том числе алфавитизация слов статей), легко порождаются различные указатели. Для редактирования словаря можно привлекать компьютерные программы проверки орфографии.

Последний этап — формирование текста словаря, создание оригинал-макета книги — тоже облегчается. ПО позволяет выдать текстовый материал сразу из базы данных с разметкой под топографематические выделения. Поля записи базы данных трансформируются в автоматическом режиме в зоны словарной статьи с соответствующими шрифтами, кеглями, курсивом, подчеркиваниями и пр.

Традиционная технологияКомпьютерная технология
1. Формирование словника словаря 2. Поиск примеров и формирование картотеки примеров 3. Написание словарных статей 4. Создание рукописи словаря 5. Перепечат. рукописей 6. Редактирование слов. стат. 7. Авторская доработка 8. Перепечатка рукописи 9. Корректура 10. Перепечатка рукописи 11. Набор, верстка 12. Корректура 13. Печать словаря 14. Словарь1. Формирование корпуса текстов 2. Автоматическое формирование корпуса примеров 3. Написание словарных статей 4. Ввод словарных статей в базу данных 5. Редактирование словарных статей в БД 6. Корректура текста в БД 7. Порождение текста словаря и формир. оригинал-макета 8. Печать словаря 9. Словарь

Для создания оригинал-макета (верстки) словарей существуют специальные издательские системы: например, пакет программ Quark-X-Press, различные версии программ Page-Maker и WinWord. Позволяют редактировать и верстать текст, изменять стили и оформление текста, положение на странице и т.п.

— автоматические словари конечного пользователя-человека (АСКП),

— автоматические словари для программ обработки текста (АСПОТ).

АСКП по интерфейсу и структуре словарной статьи отличаются от АС, включ. в системы машинного перевода и т. д. Чаще всего они — компьют. версии хорошо известных обычных словарей. #компьют. аналоги толковых словарей англ. яза (автоматич. Версия ТС «Коллинз», автом. вар. «Нового большого англо-русск. словаря» Апресяна), компьют. версия словаря Ожегова. АСКП почти повторяют структуру словарной статьи обычных словарей, но есть преимущ-ва: многие АСКП позволяют сортировать данные по полям словарной статьи, проводить автоматич. поиск всех вокабул, имеющих в толковании определенный семантический компонент и т. д.

АСПОТ обычно не предназн. для пользователя. Особенности их структуры, сфера охвата словарного материала задаются теми программами, которые с ними взаимодейств. #количество зон словарной статьи такого словаря может варьировать от одной до сотни.

Области Лгр описания: может быть синтакс. словарь, семантич. сл., сл. морфем, словарь и т.д. АС, используемые в системах ИП, имеют вид тезаурусов, а АС систем машинного перевода включают подробную инфо о морфологических, синтаксических и семантических особенностях функционир. слова.

АС можно классиф. по тем же парам-рам, что и обычные словари.

«Грамматический словарь» Зализняка в машинной форме реализуется как часть большинства компьютерных программ, предусматривающих морфолог. анализ или синтез словоформ РЯ. #системы проверки орфографии, распознавания письм. текста.

Компьютерная форма представления словарной инфо и целевая ориентация АСПОТ позволяет создавать комплексные словари с разнообразной грамм. и лексич. инфо. #один из стандартов автомат. переводных словарей, разраб. во Всероссийском центре переводов (ВЦП), включает:

1) заглавная единица, или лексический вход (морфема, слово, словосочет. в канонич. форме);

2) лексико-грамматический класс (принадлежн. к части речи; для словосоч. часть речи определяется в зав-ти от синтаксич. ф-ции); 2 а) лексико-грамматический класс русского переводного эквивалента;

3) морфолого-грамматическая инфо (включает не только инфо о словоизменении, но и о стандартных сокращениях заглавной единицы); 3 а) сокращения русского переводного эквивалента;

4) тематическая рубрика и стилевая характеристика;

5) индекс надежности перевода, отражающий степень общепринятости русского эквивалента;

6) русские переводные эквиваленты (с порядковыми номерами); если перевода нет, то ставится спец маркер и заполняется зона толкования;

7) пояснительные пометы, уточняющие значение заглавной единицы;

8) толкование заглавной единицы;

9) примеры употребления;

10) фразеол сочетания с заглавной единицей;

11) инфо об авторе или редакторе словарной статьи;

12) источник переводного эквивалента;

13) дата составления или редактирования словарной статьи.

Самые известные автом. переводные словари — многоязычные. #AC LEXIC содержит лексикогр. данные по нем, англ, франц, русск, итал, датск и португ язам.

Автоматические словари конкордансов содержат в машинном виде примеры на употребление всех слов (словоформ), представл. в конкретном произвед. или в творческом наследии писателя.

ABBYY Lingvo — семейство электронных (с 1989) и печатных (с 2007) словарей. Создано российской компанией ABBYY. 31 мая 2011 года вышла последняя версия x5 (икс пять). 12 августа 2010 года вышла версия для Mac OS X[1]. Объём словарных статей составляет более 8,7 млн. Lingvo в переводе с языка эсперанто означает «язык», о чём есть статьи в словарях ABBYY Lingvo (LingvoUniversal и LingvoComputer).

Многоязычная версия охватывает 15 языков — русский, украинский, английский, немецкий, французский, испанский,итальянский, турецкий, латинский, китайский, португальский, татарский, казахский, шведский, польский и финский. Также существует Европейская версия — 130 словарей на 7 языках и англо-русско-английский электронный словарь.

В ABBYY Lingvo нет функции полнотекстового перевода, но возможен пословный перевод текстов из буфера обмена. В некоторых словарях на английском, немецком и французском большинство слов озвучены профессиональными дикторами — носителями языка.

В состав программы входит обучающий модуль Lingvo Tutor, помогающий запоминать новые слова.

Помимо существующих 150 профессиональных словарей, результата лексикографической работы сотрудников компании ABBYY и авторитетных бумажных и электронных словарей существует обширная база бесплатных пользовательских словарей для программы. Словари предварительно проверяются и находятся в общем доступе на сайте ассоциации лексикографов Lingvo.

Словарная статья в Lingvo содержит всю необходимую информацию о слове или словосочетании: его перевод и значения, транскрипцию, ударение и произношение, примеры употребления и грамматические формы.

Словарь можно установить на настольный компьютер или ноутбук, карманный компьютер и смартфон.

Основные возможности

10 языков: английский, немецкий, французский, итальянский, испанский, китайский, турецкий, украинский, русский и латинский

Толковый словарь английского языка

Общелексические, тематические и лингвострановедческие словари

Толковый словарь русского языка

Самая современная, постоянно обновляемая лексика

Подробные словарные статьи

Средства для изучения языка

Озвученные дикторами слова

Более 130 дополнительных бесплатных словарей

Установка на компьютер или ноутбук, карманный компьютер и смартфон.

Источник

Электронный словарь. Отличие электронных и традиционных словарей.

Лекция 7

Компьютерная лексикография

Понятие компьютерной лексикографии. Электронный словарь. Отличие электронных и традиционных словарей. Состав словарной статьи. Виды электронных словарей. Преимущества электронных словарей. Перспективы компьютерной лексикографии.

Понятие компьютерной лексикографии.

Компьютерная лексикография представляет собой раздел при­кладной лингвистики, нацеленный на создание компьютерных сло­варей, лингвистических баз данных и разработку программ под­держки лексикографических работ.

Основными задачами традиционной и компьютерной лексико­графии являются определение структуры словаря и зон словарной статьи, а также разработка принципов составления различных видов словарей.

Словарь традиционно определяется как организованное собра­ние слов с комментариями, в которых описываются особенности структуры и/или функционирования этих слов.

Электронный словарь. Отличие электронных и традиционных словарей.

Электронный (автоматический, компьютерный) словарь — это собрание слов в специальном компьютерном формате, предназначенное для исполь­зования человеком или являющееся составной частью более сложных компьютерных программ (например, систем машинного пере­вода). Соответственно, различаются автоматические словари ко­нечного пользователя-человека (АСКП) и автоматические словари для программ обработки текста (АСПОТ).

Автоматические словари, предназначенные для конечного поль­зователя, чаще всего являются компьютерными версиями хорошо известных обычных словарей, например:

• Оксфордский словарь английского языка (www.oed.com),

• автоматический толковый словарь английского языка издатель­ства «Коллинз» (www.mycobuild.com),

• автоматический вариант «Нового большого англо-русского сло­варя» под ред. Ю.Д. Апресяна и Э.М. Медниковой (http://eng-rus. slovaronline. com),

• словарь Ожегова онлайн (http://slovarozhegova.ru).

Автоматические словари такого типа практически повторяют структуру словарной статьи обычных словарей, однако они обладают функциями, недоступными своим прототипам, например, осущест­вляют сортировку данных по полям словарной статьи (ср. отбор всех прилагательных), проводят автоматический поиск всех вокабул, име­ющих в толковании определенный семантический компонент, и т.д.

Автоматические словари для систем машинного перевода, автома­тического реферирования, информационного поиска и т.д. (АСПОТ) по интерфейсу и структуре словарной статьи существенно отлича­ются от АСКП. Особенности их структуры, сфера охвата словарного материала задаются теми программами, которые с ними взаимодей­ствуют. Такой словарь может содержать от одной до сотни зон сло­варной статьи. Чрезвычайно разнообразны и области лексикографического описания: морфологическая, лексическая, синтаксическая, семантическая и т.д.

Структура традиционного словаря обычно включает следующие компоненты:

• введение, объясняющее принципы пользования словарем и даю­щее информацию о структуре словарной статьи;

• словник, включающий единицы словаря: морфемы, лексемы, слово­формы или словосочетания; каждая такая единица с соответствую­щим комментарием представляет собой словарную статью;

• список условных сокращений и алфавит.

В электронных словарях из названных компонентов обязатель­ным является, пожалуй, лишь словник, в онлайн-словарях нередко имеется также алфавит с заложенными за каждой буквой гиперссыл­ками, ведущими к тексту словарной статьи. Практически в каждом электронном словаре, предлагаемом на диске (оффлайн-словарь) или в Интернете (онлайн-словарь) имеется функция автоматиче­ского поиска, позволяющая значительно экономить усилия пользователя при работе со словарем.

Отличие электронных словарей от «бумажных» касается также их мультимедийности и гипертекстуальности: эти свойства выраже­ны в электронных словарях в значительно большей степени, чем в печатных. Так, гиперссылки могут быть заложены за любым эле­ментом словарной статьи или пунктом программного меню словаря. Это дает пользователю дополнительные возможности по поиску и быстрому переходу к необходимой словарной информации, позво­ляя найти синонимы и антонимы к заданному слову, слова той же семантической группы, парадигмы склонения и спряжения и т.д.

Гиперссылки позволяют также легко связывать разные словари друг с другом, так что в итоге онлайн- или оффлайн-словари оказы­ваются коллекциями или порталами словарей. Получив необходи­мую информацию, например, о значении слова, пользователь одним нажатием ссылки может перейти к комментариям этого слова в дру­гих словарях и узнать особенности его толкования в специальных отраслях знания (терминологические словари) или получить допол­нительную лингвистическую информацию о его форме.

Отдельные электронные словари имеют также дополнительные возможности, например, электронный многоязычный словарь ABBYY Lingvo хЗ (© 2008 ABBYY) предоставляет функцию обучения (ABBYY Lingvo Tutor), позволяющую запоминать слова, отобранные по кон­кретной теме и представленные парами: русское и иностранное сло­во, составлять новые словари и словарные карточки, сохранять ре­зультаты обучения в файл и т.д.

В итоге структура электронного словаря в значительной степени отличается от структуры словаря печатного, хотя основная часть словаря — словник со словарными статьями — продолжает состав­лять ядро словаря в обоих случаях.

Источник

Глава 3. Оптимизация эпистемической функции языка. идиом [Баранов, Добровольский 1995]

Лексикография 85

что включает в себя понятие аспот. image004. что включает в себя понятие аспот фото. что включает в себя понятие аспот-image004. картинка что включает в себя понятие аспот. картинка image004.

идиом [Баранов, Добровольский 1995]. Иными словами, корпус примеров формируется не только в результате обработки корпуса текстов, но и базы данных — см. рис. 3. Для словарей писателей может быть предусмотрен этап формирования корпуса текстов писателей-современников, необхо­димый для выявления различий между особенностями идиостиля данного автора и общими характеристиками языка соответствующей эпохи.

что включает в себя понятие аспот. image006. что включает в себя понятие аспот фото. что включает в себя понятие аспот-image006. картинка что включает в себя понятие аспот. картинка image006.

Особо следует упомянуть о существовании издательских систем, ис­пользуемых для создания оригинал-макета (верстки) словарей. К ним относятся, например, издательский пакет программ Quark-X-Press, раз­личные версии программ Page-Maker и WinWord. Для словарной верстки наиболее удобны системы, имеющие встроенные языки, позволяющие формировать макросы — относительно простые, но технологически эф­фективные операции обработки редактируемого и верстаемого текста. К ним относятся процедуры приписывания стилей зонам словарной статьи, алфавитизации, создания указателей и т.п.

Автоматические словари.Автоматический словарь — это словарь в специальном машинном формате, предназначенный для использова­ния на ЭВМ пользователем или компьютерной программой обработки текста. Иными словами, различаются автоматические словари конечного

Глава 3. Оптимизация эпистемической функции языка

Лексикография

пользователя-человека(АСКП)[16] и автоматические словари для программ обработки текста(АСПОТ). Автоматические словари, предназначенные для конечного пользователя, по интерфейсу и структуре словарной статьи существенно отличаются от АС, включенных в системы машинного пе­ревода, системы автоматического реферирования, информационного по­иска и т. д. Чаще всего они являются компьютерными версиями хорошо известных обычных словарей. Так, на рынке программного обеспечения имеются компьютерные аналоги толковых словарей английского языка (автоматический Вебстер, автоматический толковый словарь английского языка издательства «Коллинз», автоматический вариант «Нового большо­го англо-русского словаря» под ред. Ю. Д. Апресяна и Э. М. Медниковой), существует компьютерная версия словаря Ожегова, которая, впрочем, по­ка не имеет широкого коммерческого распространения. Автоматические словари такого типа практически повторяют структуру словарной ста­тьи обычных словарей, однако они обладают функциями, недоступными своим прототипам. Например, многие АСКП позволяют осуществлять сортировку данных по полям словарной статьи (ср. отбор всех прила­гательных), проводить автоматический поиск всех вокабул, имеющих в толковании определенный семантический компонент и т. д.

Автоматические словари для программ обработки текста можно на­звать автоматическими словарями в точном смысле. Они, как правило, не предназначены для обычного пользователя. Особенности их структуры, сфера охвата словарного материала задаются теми программами, которые с ними взаимодействуют. Так, количество зон словарной статьи такого словаря может варьировать от одной до сотни. Чрезвычайно разнообразны и области лексикографического описания. Это может быть синтаксиче­ский словарь, семантический словарь, словарь морфем, псевдооснов, словарь устойчивых словосочетаний и т. д. АС, используемые в системах информационного поиска, имеют вид тезаурусов, а АС систем машин­ного перевода включают подробную информацию о морфологических, синтаксических и семантических особенностях функционирования слова.

В принципе, к автоматическим словарям можно применить те же па­раметры классификации, которые подходят для обычных словарей. Есть примеры обычных словарей, которые широко используются как АСПОТ. Так, грамматический словарь А. А. Зализняка [Зализняк 1977] в машинной форме реализуется как часть подавляющего большинства компьютерных программ, предусматривающих морфологический анализ или синтез сло­воформ русского языка. К программам такого рода относятся, например, многочисленные системы проверки орфографии, распознавания пись­менного текста.

Наиболее известные автоматические переводные словари, как пра­вило, являются многоязычными. Так, AC LEXIC содержит лексикогра­фические данные по немецкому, английскому, французскому, русскому, итальянскому, датскому и португальскому языкам; автоматический пе­реводной словарь ВЦП включает переводные эквиваленты по четырем языкам: английскому, немецкому, французскому и русскому.

Важным типом АС являются автоматические словари конкордансов, содержащие в машинном виде примеры на употребление всех слов (сло­воформ), представленных в конкретном произведении или в творческом наследии писателя.

что включает в себя понятие аспот. image008. что включает в себя понятие аспот фото. что включает в себя понятие аспот-image008. картинка что включает в себя понятие аспот. картинка image008.Задание1. Определите параметры, на основании которых выделяются:

• одноязычные vs. многоязычные словари;

• обычные словари vs. фразеологические словари vs. словари пословиц и по­говорок vs. словари цитат;

• словари литературного языка vs. словари жаргонов vs. терминологические словари.

Источник

Лекция 7 Компьютерная лексикография Понятие компьютерной лексикографии. Электронный словарь. Отличие электронных и традиционных словарей. Состав словарной статьи. Виды электронных словарей. Преимущества электронных словарей. Перспективы компьютерной лексикографии

что включает в себя понятие аспот. 1518720528qf1f8. что включает в себя понятие аспот фото. что включает в себя понятие аспот-1518720528qf1f8. картинка что включает в себя понятие аспот. картинка 1518720528qf1f8.

Понятие компьютерной лексикографии. Электронный словарь. Отличие электронных и традиционных словарей. Состав словарной статьи. Виды электронных словарей. Преимущества электронных словарей. Перспективы компьютерной лексикографии.

1. Понятие компьютерной лексикографии.

Компьютерная лексикография представляет собой раздел при­кладной лингвистики, нацеленный на создание компьютерных сло­варей, лингвистических баз данных и разработку программ под­держки лексикографических работ.

Основными задачами традиционной и компьютерной лексико­графии являются определение структуры словаря и зон словарной статьи, а также разработка принципов составления различных видов словарей.

Словарь традиционно определяется как организованное собра­ние слов с комментариями, в которых описываются особенности структуры и/или функционирования этих слов.

2. Электронный словарь. Отличие электронных и традиционных словарей.

Электронный (автоматический, компьютерный) словарь — это собрание слов в специальном компьютерном формате, предназначенное для исполь­зования человеком или являющееся составной частью более сложных компьютерных программ (например, систем машинного пере­вода). Соответственно, различаются автоматические словари ко­нечного пользователя-человека (АСКП) и автоматические словари для программ обработки текста (АСПОТ).

Автоматические словари, предназначенные для конечного поль­зователя, чаще всего являются компьютерными версиями хорошо известных обычных словарей, например:

• автоматический толковый словарь английского языка издатель­ства «Коллинз» (www. ),

• автоматический вариант «Нового большого англо-русского сло­варя» под ред. и (http://eng-rus. ),

• словарь Ожегова онлайн (http://slovarozhegova. ru).

Автоматические словари такого типа практически повторяют структуру словарной статьи обычных словарей, однако они обладают функциями, недоступными своим прототипам, например, осущест­вляют сортировку данных по полям словарной статьи (ср. отбор всех прилагательных), проводят автоматический поиск всех вокабул, име­ющих в толковании определенный семантический компонент, и т. д.

Автоматические словари для систем машинного перевода, автома­тического реферирования, информационного поиска и т. д. (АСПОТ) по интерфейсу и структуре словарной статьи существенно отлича­ются от АСКП. Особенности их структуры, сфера охвата словарного материала задаются теми программами, которые с ними взаимодей­ствуют. Такой словарь может содержать от одной до сотни зон сло­варной статьи. Чрезвычайно разнообразны и области лексикографического описания: морфологическая, лексическая, синтаксическая, семантическая и т. д.

Структура традиционного словаря обычно включает следующие компоненты:

• введение, объясняющее принципы пользования словарем и даю­щее информацию о структуре словарной статьи;

• словник, включающий единицы словаря: морфемы, лексемы, слово­формы или словосочетания; каждая такая единица с соответствую­щим комментарием представляет собой словарную статью;

• список условных сокращений и алфавит.

В электронных словарях из названных компонентов обязатель­ным является, пожалуй, лишь словник, в онлайн-словарях нередко имеется также алфавит с заложенными за каждой буквой гиперссыл­ками, ведущими к тексту словарной статьи. Практически в каждом электронном словаре, предлагаемом на диске (оффлайн-словарь) или в Интернете (онлайн-словарь) имеется функция автоматиче­ского поиска, позволяющая значительно экономить усилия пользователя при работе со словарем.

Отличие электронных словарей от «бумажных» касается также их мультимедийности и гипертекстуальности: эти свойства выраже­ны в электронных словарях в значительно большей степени, чем в печатных. Так, гиперссылки могут быть заложены за любым эле­ментом словарной статьи или пунктом программного меню словаря. Это дает пользователю дополнительные возможности по поиску и быстрому переходу к необходимой словарной информации, позво­ляя найти синонимы и антонимы к заданному слову, слова той же семантической группы, парадигмы склонения и спряжения и т. д.

Отдельные электронные словари имеют также дополнительные возможности, например, электронный многоязычный словарь ABBYY Lingvo хЗ (© 2008 ABBYY) предоставляет функцию обучения (ABBYY Lingvo Tutor), позволяющую запоминать слова, отобранные по кон­кретной теме и представленные парами: русское и иностранное сло­во, составлять новые словари и словарные карточки, сохранять ре­зультаты обучения в файл и т. д.

В итоге структура электронного словаря в значительной степени отличается от структуры словаря печатного, хотя основная часть словаря — словник со словарными статьями — продолжает состав­лять ядро словаря в обоих случаях.

3. Состав словарной статьи.

Структура словарной статьи достаточно типична и обычно вклю­чает следующие зоны словарной статьи, актуальные как для тради­ционной, так и для компьютерной лексикографии:

• лексический вход (вокабула, лемма);

• зона грамматической информации;

• зона стилистических помет;

• зона примера и источника примера.

Правда, можно выделить зоны словарной статьи, обязательные для всех словарных единиц, и факультативные зоны. Обязательной зоной словарной статьи для разных видов словарей является лишь лексический вход, все остальные зоны зависят от типа словаря: на­пример, для толкового словаря необходима зона значения, а для ор­фоэпического она необязательна. Зона фразеологии отсутствует в комментариях слов, не используемых в устойчивых сочетаниях, а наличие зоны примера и его источника зависит от принципов, лежа­щих в основе создания словаря.

Количество зон словарной статьи компьютерного словаря обыч­но превышает количество зон словарной статьи «бумажного» слова­ря, что обусловлено значительными ресурсами памяти и высокой скоростью обработки цифровой информации современными ком­пьютерами. Но объем предлагаемой словарной информации должен соответствовать виду словаря: если читателю нужно произношение, то «лишняя» информация о переводе проверяемого слова или его контекстных значениях будет только мешать пользователю.

4. Виды электронных словарей.

Классификацию компьютерных словарей можно осуществлять на тех же принципах, что и классификацию обычных словарей. Тради­ционно выделяются лингвистические, энциклопедические и проме­жуточные (лингвострановедческие и терминологические) словари. В лингвистических словарях описываются сами слова — их значения, особенности употребления, структурные свойства, сочетаемость, со­отношение с лексическими системами других языков и т. д. В энцикло­педических словарях описываются понятия, факты и реалии окружающего мира, т. е. экстралингвистическая информация. Промежуточ­ный тип словарей включает информацию и лингвистического, и экстралингвистического рода.

Среди лингвистических словарей можно выделить несколько их видов:

• толковые, имеющие целью толкование (объяснение) значений слов и их употребления в речи, включающие дескриптивные и нормативные словари, которые, кроме того, могут быть общими и частными, среди последних выделяются, например, фразеологические словари, словари иностранных слов и т. д.;

• словари-тезаурусы, отличающиеся расположением словарной статьи, которое подчинено не алфавитному, а тематическому прин­ципу, например, тезаурус русской идиоматики включает семан­тическое поле «УХОД, ОТЪЕЗД, БЕГСТВО», которое помещена в категорию «ДВИЖЕНИЕ», семантическое поле «ДАВНО» по­мещено в категорию «ВРЕМЯ» и т. д.;

• двуязычные (переводные) словари, например, «Англо-русский словарь» (1-е издание появилось в 1943 г.), «Фран­цузско-русский словарь активного типа» под ред. и Ж. Триомфа и др.;

• ассоциативные словари, объектом которых является сфера ассоциативных отношений в лексике; словарная статья такого слова­ря включает лексему-стимул и список упорядоченных по часто­те и алфавиту (с указанием частоты) реакций, полученных в пси­холингвистическом эксперименте, например: «Ассоциативный тезаурус современного русского языка»;

• исторические и этимологические словари, предоставляющие информацию об истории слов, начиная с определенной даты на протяжении некоторого периода, с указанием возникновения но­вых слов и значений, их отмирании и видоизменении, или объ­ясняющие происхождение слов;

• словари языковых форм, которые фиксируют особенности фор­мы слов и в которых толкования значений отсутствуют или игра­ют вспомогательную роль, например, орфографические и орфо­эпические, словообразовательные и морфемные (показывают, как слова складываются из морфем и инвентаризуют их), грам­матические (информация по каждому слову, позволяющая по­ строить любую грамматически правильную форму), обратные словари (слова располагаются по алфавиту не начальных, а конечных букв, и выравниваются не по левому, а по правому краю: герб, серб, ущерб, горб, дуб);

• словари речевого употребления: словари трудностей и сочетае­мости слов;

• ономастиконы: антропонимические словари и топонимические словари;

• нетрадиционные, подвергающие словарному описанию нетипич­ные лингвистические объекты, например, «Словарь русских по­литических метафор» и [5], сло­вари поэтических метафор, эпитетов, авторские словари и слова­ри конкордансов.

Например, известны такие электронные энциклопедии, как Энциклопедия Британника (www. ), «Большая энциклопедия Кирилла и Мефодия» (www. megabook. ru) и энциклопедия «Кругосвет» (www. krugosvet. ru).

Примерами переводных электронных словарей выступают ABBYY Lingvo (www. lingvo. ru), Translatelt! (www. translateit. ru) и Multitran (www. multitran. ru).

Электронные толковые словари — это, в частности, словарь Merriam Webster (www. ) и словарь французского языка «Tresor de la langue francaise» (http://atilf. atilf. fr); Словарь Ефремовой (http://slovar. plib. ru/dictionary/d1/); Словарь Ожегова (http://slovar. plib. ru/dictionary/d19/)

Формальными электронными словарями являются орфогра­фические словари русского (http://slovari. yandex. ru) и английского (www. ) языков.

Большую коллекцию словарей разных видов на дисках и в Интернете предоставляет издательство Duden (немецкий язык, www. duden. de) и Larousse (французский язык, www. larousse. fr).

5. Преимущества электронных словарей.

1) формирование корпуса текстов и параллельно создание словника;

2) автоматическое формирование корпуса примеров;

3) написание словарных статей;

4) ввод словарных статей в базу данных (БД);

5) редактирование словарных статей в БД;

6) корректура текста в БД;

7) порождение текста словаря и формирование оригинал-макета;

Конечно, приведенное описание процесса создания электронно­го словаря может корректироваться в зависимости от его вида, иссле­довательских принципов и других факторов, ср. комментарии созда­телей электронного исторического словаря русского языка. Но в любом случае использование компьютеров и уже готовых корпу­сов текстов в компьютерной лексикографии позволяет уменьшить количество этапов в процессе создания электронного словаря и сэко­номить время практически на каждом из них.

Так, вместо создания словарной карточки в компьютерной лек­сикографии используются базы данных. Записи баз данных дают воз­можность автоматически сортировать массив по выбранным пара­метрам, отбирать нужные примеры, объединять их в группы и т. д. Специализированных программных оболочек для лексикографических целей на рынке практически нет. Для этих целей вполне подходят современные базы данных типа ACCESS или PARADOX. Для поиска примеров создатели словарей могут использовать компью­терные программы построения конкордансов, например, DIALEX. Для создания оригинал-макета (верстки) словарей привлекаются из­дательские системы типа Page-Maker или WinWord, которые позво­ляют приписывать стили зонам словарных статей, алфавитизацию, создание указателей и т. д.

Электронные словари имеют положительные стороны не только в процессе их создания, но и в процессе использования. В частности, выделяются следующие преимущества в использовании электрон­ных словарей:

1) Использование мультимедий­ных средств. Электронные словари позволяют по-разному представить содер­жание словарной статьи (различные «проекции» словаря), в том числе с помощью разнообразных графических и мультимедий­ных средств, которые не используются в обычных словарях;

2) Использование современных технологий. В выдаваемой информации находят отражение различные техно­логии компьютерной лингвистики, например морфологический и синтаксический анализ, распознавание и синтез звука и т. п.;

3) Удобный поиск. Становится возможным быстро получить информацию, которая содержится где-то в недрах словаря и непосредственно отвечает тому запросу, который сформулирован пользователем в удобной для него форме. Нет необходимости помнить слово в точности, программа сама предложит варианты по первым буквам.

4) Актуальность и динамичность. Электронный словарь позволяет быстро реагировать на изменения в языке и мире, и выпуск каждой последующей его версии или внесение изменений в онлайн-версию не занимает много време­ни и труда.

5) Большой объем словарной базы. У большинства электронных словарей терминологическая база превышает базу бумажных словарей и предоставляет более удобный доступ к информации за счет использования гиперссылок.

6) Вариативность в использовании — возможность использования словарей в локальной и глобальной сетях, т. е. использование оффлайновой и онлайновой версии.

7) Универсальность — как правило, программы позволяют работать сразу с несколькими языками и направлениями перевода. Возможно использование любого из включённых в словарь языков в качестве входного.

6. Перспективы компьютерной лексикографии.

Несмотря на наличие значительного числа преимуществ исполь­зования электронных словарей, остаются нерешенными некоторые проблемы, актуальные как для традиционной, так и для компьютерной лексикографии.

• В словарях должно найти отражение понятие лексической функ­ции, позволяющее систематически описывать несвободную со­четаемость слов, иллюстрируемую следующими примерами рус­ского языка: «войну ведут», а «экзамен — держат», «теории вы­двигают», а «мысли подают» и т. п.

• Не нашла отражение в массовой лексикографической практике проблема описания семантики и практической реализации грам­матического словоизменения и словообразования. Каждый язык имеет свои собственные способы грамматического кодирования смысла, которые не описываются в массовых словарях система­тически. Например, как передать по-английски смысл «довыпендриваться», даже если знаешь, как передать «выпендриваться»?

• В словарях не существует даже системы понятий, с помощью ко­торой синтаксическая информация могла бы быть доведена до обычного читателя. Решением этой проблемы могли бы стать интегральные словарные описания, основанные на формальных моделях, учитывающие прогрессивные лексикографические идеи. На этих же моделях следует организовать технологии до­ступа к словарному содержанию.

Названные проблемы могут быть решены при сотрудничестве лексикографов-теоретиков и практиков, а компьютерные инстру­менты, несомненно, облегчат рутинную работу по осуществлению монотонных лексикографических операций.

В целом констатируем, что компьютерная лексикография, на­правленная на создание электронных словарей, представляет собой весьма перспективное и нужное направление компьютерной линг­вистики, поскольку создаваемые ею продукты — электронные сло­вари — отличаются многогранностью, мультимедийностью, инте­грацией новейших технологических решений, актуальностью мате­риала и отвечают потребностям пользователя в организации доступа к необходимой информации.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *