Отправляет email-рассылки с помощью сервиса Sendsay

[Саха Википедия] Методическое пособие ЮНЕСКО: Как обеспечить присутствие языка в киберпространстве. Часть 3

Продолжаю цитировать для обсуждения некоторые главы книги, название которой вынесено
в заголовок.

2.4.Первые базовые ресурсы
2.4.1. Набор знаков и кодировка
(...) Для создания шрифтов для редких языков в Интернете доступны, в частности,
следующие сайты:
http://scripts.sil.org/TypeDesigneResourses (шрифты, готовые к применению, и
инструменты их создания);
http://scripts.sil.org/SILFontList
http://scripts.sil.org/SILEncore_Glyphs

2.4.2. Виртуальные клавиатуры
(...) в случае с функционально ограниченными языками не стоит надеяться в обозримом
будущем на получение собственной "физической" клавиатуры. На данный момент проще
разработать виртуальную клавиатуру. (...)

2.4.3. Программы обработки данных на компьютере
После того, как вы начали использовать специальные шрифты надо подумать о базовых
инструментах, которые позволят произвести алфавитную сортировку, конверсию кодов
знаков, выравнивание текстов и т.д. Эти инструменты очень пригодятся для обработки
текстового материала, составляемого на функционально ограниченном языке, для
дальнейшего применения такого материала в киберпространстве. Наиболее пригодными
для обработки языков являются нижеприведенные прикладные программы BPI:
1. Record - представляет собой программу автоматического конвертирования текстов
из одной кодировки в другую. С помощью этой программы можно обрабатывать и запоминать
около 175 различных кодировок и около дюжины комплектов файлов. В зависимости
от пары кодировок, указанных в запросе (исходной и итоговой), Record производит
перекодирование одного или нескольких файлов. Поскольку каждая кодировка может
работать в паре с большинством из остальных 174 кодировок, становится возможным
проведение тысяч различных схем конвертирования.
2. Ventile - представляет собой программу статистической обработки текстов. На
основе текстовых элементов Ventile дает возможность подсчитывать количество параграфов,
фраз, слов и знаков в файле. На основе текстовой статистики Ventile производит
измерение абсолютной частоты, три измерения средних значений (моду, медиану и
среднее арифметическое) и пять измерений разброса (минимум, максимум, разница
квартилей, среднее отклонение, стандартное отклонение). Статистические результаты
воспроизводятся в виде числовой таблицы или графически, в виде столбчатой диаграммы
(гистограммы).
3. Vokable - представляет собой программу производства алфавитных индексов. Этот
инструмент дает возможность произвести анализ текстов и составить перечень слов,
используемых в этих текстах. Списки могут быть составлены в обычном алфавитном
порядке, в порядке, обратном алфавитному, или в порядке частоты использования.
Каждое слово может сопровождаться показателем частоты его применения с перечнем
всех мест, где это слово встречается в тексте.
4. Concord - является программой согласования слов в контексте. Этот инструмент
позволяет сделать выборку текстовых файлов и составить алфавитный перечень ведущих
элементов с их непосредственным контекстом. Ведущий согласованный элемент может
базироваться на словах в их фразовых контекстах или на знаках в контексте слов,
в которых они употреблены. Ведущие элементы могут приводиться в обычном алфавитном
порядке или в обратном алфавитном порядке.
5. Alibi - является программой параллельного выстраивания
текстов (или сравнения текстов на различных языках). С помощью этого инструмента
можно сделать выборку по двум параллельным файлам и автоматически вывести текстовые
компоненты этой пары файлов. В качестве текстовых компонентов Alibi может сопоставлять
как параграфы или фразы, так и отдельные слова обоих текстов.

Воспользоваться этими программами сможет далеко не каждый. Они действительно
очень эффективны и имеют то преимущество, что их можно применять в рамках наиболее
популярных операционных систем (Windows и Linux). Вместе со шрифтами и виртуальными
клавиатурами эти программы являются базовыми ресурсами для работы с функционально
ограниченными языками.

Конец цитаты.
Полный текст книжки в формате pdf лежит на сайте ИФАПКОМ. Следующий мой выпуск
будет посвящен локализации программ.

Николай Павлов

Саха Википедия - http://incubator.wikimedia.org/wiki/Wp/sah

Ответить   Fri, 04 Jan 2008 06:05:05 +0300 (#715314)