Отправляет email-рассылки с помощью сервиса Sendsay

Кодировки за и против

Здравствуйте !

Подскажите пожалуста какую кодировку лучше использовать в Линукс
CP1251, KOI или UTF8
и почему?

С уважением Игорь Тарасюк

Ответить   Igor Thu, 1 Sep 2005 12:13:05 +0300 (#428225)

 

Ответы:

Доброе утро.

В Чтв, 01.09.2005, в 13:13, Igor пишет:


Только UTF8.

1) Международный стандарт
2) Стандартная кодировка для Ext3.
3) Никаких проблем с различными языками.

Из минусов - неготовность до сих пор некоторых компонент GNU/Linux
работать с ней. Впрочем, если берете практически любой современный
дистрибутив вроде SuSE или Fedora Core, то оно все равно - дистрибьюторы
аккуратно все сглаживают.

[Эх, тут бы еще пнуть Subscribe за неподдержку UTF8...]

--
Roman
,---------------------------. ,--------------------------.
/ http://www.3os.ru/ V http://www.osrc.info/ \ .o.
\ mailto: rik@3*****.ru ^ mailto: rik@o*****.info / ..o
`---------------------------' `--------------------------' ooo
gpg --recv-keys 0xE5E055C3 --keyserver hkp://subkeys.pgp.net

-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21232; Возраст листа: 769; Участников: 1404
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/428447

Ответить   Roman I Khimov Thu, 01 Sep 2005 16:27:44 +0400 (#428447)

 

несколько раз, да в живот, в живот....

-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21234; Возраст листа: 769; Участников: 1404
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/428548

Ответить   Thu, 01 Sep 2005 17:24:35 +0300 (#428548)

 

несколько раз, да в живот, в живот....

-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21235; Возраст листа: 769; Участников: 1404
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/428551

Ответить   Thu, 01 Sep 2005 17:24:35 +0300 (#428551)

 

В Чтв, 01/09/2005 в 16:27 +0400, Roman I Khimov пишет:

KOI8-R тоже

А с каких пор в Linux-овых ФС стала какое-то значение играть кодировка
(в смысле не ФС-ное это дело).

Если нужны одновременно русский, ангийслкий, китайский, иврит и др.
то UTF-8 единсственный вариант. Но для большинства пользователей
прекрасно подойдет и KOI8-R

Все ли? А zsh там уже нормально с UTF-8 работает?

Общий вывод: с KOI8-R проблем не будет. С UTF-8 могут быть. ИМХО если
вам не нужно работать с кучей языков одновременно? то лучше - KOI8-R.

-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21237; Возраст листа: 769; Участников: 1404
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/428560

Ответить   Max Vasin Thu, 01 Sep 2005 18:44:55 +0400 (#428560)

 

Доброе утро.

В Чтв, 01.09.2005, в 18:44, Max Vasin пишет:


Копните архивы LKML, это так. И очень жаль, что это не дело ФС,
поскольку в отсутствие "языкатых" опций монтирования с нестандартными
кодировками приходится маяться (BTW, в этом смысле Joliet на голову выше
Rockridge на CD, хоть последний и является стандартом в отличие от
первого). Ext3 позволяет использовать разные кодировки, но все это уже
нестандартно.


Дело в том, что UTF-8 позволяет вообще не думать о языках, а KOI8
работает только до тех самых замечательных пор, пока не приходится с их
разнообразием иметь дело и вот тогда начинается секс...

--
Roman
,---------------------------. ,--------------------------.
/ http://www.3os.ru/ V http://www.osrc.info/ \ .o.
\ mailto: rik@3*****.ru ^ mailto: rik@o*****.info / ..o
`---------------------------' `--------------------------' ooo
gpg --recv-keys 0xE5E055C3 --keyserver hkp://subkeys.pgp.net

-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21240; Возраст листа: 769; Участников: 1404
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/428646

Ответить   Roman I Khimov Thu, 01 Sep 2005 20:48:25 +0400 (#428646)

 

В Чтв, 01/09/2005 в 20:48 +0400, Roman I Khimov пишет:

С этим никто не спорит. Но вот я привык к zsh, а работать мне приходится
с текстами на русском и английском (и только!). Смысла переходить на
UTF-8 не вижу.

-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21245; Возраст листа: 770; Участников: 1404
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/428813

Ответить   Max Vasin Fri, 02 Sep 2005 00:12:53 +0400 (#428813)

 

В сообщении от 1125565985 секунд после начала Эпохи Igor написал(а):

Все зависит от того для чего вам Линукс, как вы с ним работаете и какие
приложения используете. Ну и конечно, где вы эту кодировку применяете.
В Линукс вам ничто не мешает хранить, редактировать и отображать файлы
в различных кодировках, именовать файлы в различных кодировках,
одновременно выполнять несколько приложений с различными установками
локали. В общем полная свобода!

Ответить   Konstantin Korikov Fri, 2 Sep 2005 05:36:20 +0300 (#428899)

 

On Fri, 2 Sep 2005 05:36:20 +0300
Konstantin Korikov <lostcl***@u*****.fm> wrote:

Спасибо всем откликнувшимся
Линукс хочу использовать под рабочку (под сервером он у меня давно
вертится). Надоел Windows вкрай - ресурсув жрет много (а с
антивирусом так вообще беда, особенно AVP как вцепится что нибуть
огромное проверять ;-( ) . Вот и на счeт свободы я с Вами полностью
согласен.
Но я скорее всего выберу UTF - он по умолчанию поддерживается в
дистрах (FC то точно, хочу попробовать еще SuSe), и мало что в
будущем понадобится.

Вот еще вопросик. У меня не серваке кодировка СР1251. Так исторически
сложилось, что samba кодирует в KOI8-R. Соответственно кирилица
отображается не лутшим образом. Как можно отобразить названия файлов и
каталогов в читабельном виде ?

--
С уважением
Игорь Тарасюк

Ответить   Igor Fri, 2 Sep 2005 09:34:00 +0300 (#428981)

 

А что мешает прописать нужные кодировки в опциях монтирования?
codepage=<то, что снаружи на сервере (а то samba-сервер тоже умеет
преобразовывать кодировки)>, iocharset=<то, что на Вашей машине>

-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21259; Возраст листа: 770; Участников: 1404
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/429186

Ответить   Fri, 02 Sep 2005 14:16:32 +0300 (#429186)

 

В сообщении от 1125642840 секунд после начала Эпохи Igor написал(а):

Хороший выбор. Однако, могут возникнуть небольшие проблемки со старым
(морально, и не только) софтом. Но если вы используете в основном
современные графические среды, то беспокоится не о чем.

Ну это можно исправить. Существующие имена файлов, которые в KOI8-R,
можно перекодировать в СР1251, используя convmv например. После чего
подправить конфигурационный файл Samba, и указать чтобы он кодировал
имена файлов в СР1251 (что-то типа `unix charset = СР1251', для
Samba 3.X).

Если просто отобразить:

$ ls |iconv -f KOI8-R

Ответить   Konstantin Korikov Fri, 2 Sep 2005 17:39:40 +0300 (#429413)

 

Как менять локаль лишь для приложения?

Ответить   Strong Sat, 03 Sep 2005 23:47:44 +0700 (#430657)

 

В Сбт, 03/09/2005 в 23:47 +0700, Strong пишет:

LANG=чего-там-нужно команда

-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21312; Возраст листа: 772; Участников: 1405
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/430715

Ответить   Max Vasin Sun, 04 Sep 2005 23:04:12 +0400 (#430715)

 

On Sat, 03 Sep 2005 23:47:44 +0700
Strong wrote:


Запускать надо так:
LC_ALL="ru_RU.cp1251" /usr/bin/app

--
Vladimir Rusinov aka B.
http://location.org.ru/

-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21332; Возраст листа: 773; Участников: 1405
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/431216

Ответить   Sun, 4 Sep 2005 21:40:54 +0400 (#431216)

 

А "LANG=чего-там-нужно команда" здесь при чём?

Ответить   Strong Mon, 05 Sep 2005 22:23:56 +0700 (#431262)

 

On 9/5/05, Strong <s-stro***@m*****.ru> wrote:

Здесь есть такая (полезная иногда) особенность:

языковые настройки определяются несколькими переменными окружение
(набираем команду locale и любуемся). Так вот, LANG установит те из
них, которые явно не указаны (т.е. неопределены), а LC_ALL насильно
сделает так, как будто все они имеют одно значение (именно значение
LC_ALL. Зачем может понабобиться устанавливать некоторые параметры
локализации? Вот пример:
Формат чисел в локали ru_RU предполагает, что дробная часть
отделяется запятой. Иногда это может привести к проблемам. Тогда можно
в стартовом файле шелла установить LC_NUMERIC=C, а при запуске
программ указывать LANG=страна. Страна не будет в этом случае влиять
на формат чисел.

Ответить   Mon, 5 Sep 2005 19:46:10 +0400 (#431271)

 

On Mon, 05 Sep 2005 22:23:56 +0700
Strong wrote:


LANG=locale_name может установить не все параметры locale.
LC_ALL означает, что сообщения программы будут полностью локализированы:
переведены на заданный язык (если перевод найдется), даты, цифры и ден.
еденицы будут выведены в соотвествии с национальными стандартами.

Сделайте
locale
и вы увидите все переменные оболочки, которые устанавливают локаль.
Можно сделать так, чтобы сообщения выводились на русском, но даты при
этом были бы стандартными. Вот например мой locale:
LANG=ru_RU.koi8r
LC_CTYPE="ru_RU.koi8r"
LC_NUMERIC=POSIX
LC_TIME="ru_RU.koi8r"
LC_COLLATE="ru_RU.koi8r"
LC_MONETARY="ru_RU.koi8r"
LC_MESSAGES=POSIX
LC_PAPER="ru_RU.koi8r"
LC_NAME="ru_RU.koi8r"
LC_ADDRESS="ru_RU.koi8r"
LC_TELEPHONE="ru_RU.koi8r"
LC_MEASUREMENT="ru_RU.koi8r"
LC_IDENTIFICATION="ru_RU.koi8r"
LC_ALL=

Как видно, LC_NUMERIC услановлено в POSIX. Я это сделал из-за того, что
при ru_RU разделитель десятичных дробей - запятая, а не точка, к которой
я привык.
Кроме того, LC_MESSAGES также POSIX, так что в большинстве приложений у
меня нерусский (, а стандартный зашитый в прорамму) язык сообщений.

LC_ALL не установлен, т.к. его установка переопределила бы все остальные
LC_* и LANG

--
Vladimir Rusinov aka B.
http://location.org.ru/

-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21338; Возраст листа: 773; Участников: 1405
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/431356

Ответить   Mon, 5 Sep 2005 20:43:23 +0400 (#431356)