2 Страницы  1 2 >  
Ответить Создать тему

Скан книг на Чувашском

Сканер
post Aug 9 2009, 08:48 
Отправлено #1


Активный

Сообщений: 1 160



Учимся говорить по-чувашски. Кунта ил.
опубликованное пользователем изображение

Сообщение отредактировал Сканер - Aug 9 2009, 08:49
Profile CardPM
  0/0  
Takam
post Aug 13 2009, 19:41 
Отправлено #2


какой уж там статус...

Сообщений: 2 049
Из: Мускав хули



Цитата(Сканер @ Aug 9 2009, 09:48)
Учимся говорить по-чувашски. Кунта ил.
*

Спасибо, скачал.

--------------------
Вообще-то я белый и пушистый, но очень больно кусаюсь!
Profile CardPM
  0/0  
Takam
post Aug 18 2009, 22:40 
Отправлено #3


какой уж там статус...

Сообщений: 2 049
Из: Мускав хули



Вдруг пригодится параллельный текст "Нарспи" на чувашском, русском и немецком языках.

Присоединённые файлы
Присоединённый файл  Narspi.doc ( 394,5кб ) Кол-во скачиваний: 1217


--------------------
Вообще-то я белый и пушистый, но очень больно кусаюсь!
Profile CardPM
  0/0  
MIX_V_MIX
post Aug 24 2009, 21:26 
Отправлено #4


Новичок

Сообщений: 8



Чăвашла текстсене сканерламалли программа пур-и ăçта та пулин?
Profile CardPM
  0/0  
Сканер
post Aug 25 2009, 01:39 
Отправлено #5


Активный

Сообщений: 1 160



Пур . Ыйту пулсан , кунта çыр.

forum.сhuvаsh. оrg/Чăваш халăх канашлăвĕ сайт / Компьютер таврашĕнче / Сканируем тексты:


Е:

forum.сhuvаsh. оrg/Чăваш халăх канашлăвĕ/Чăваш тетелĕ/Сканирование

(Сылкăсем кунтан теме ĕçлемеç)


Сканерлама кирек кам програмипе пулать. Вăл ĕçĕ йывăр мар те. smile.gif

Сана ,тен, ОСR кирлĕ?
ABBYY FineReader чăваш сас паллисене ăнланат.

Цитата
forum.сhuvаsh. оrg/Чăваш халăх канашлăвĕ/Чăваш тетелĕ/Сканировани

Сканирование текстов на чувашском языке с помощью FineReader-а
В меню Сервис выберите команду Редактор языков… В открывшемся диалоговом окне Редактор языков создайте новый пользовательский язык Чăваш на основе русского, нажав на кнопку Новый…

В поле Имя языка впишите Чăваш. В поле Алфавит языка: вставьте символы -.ÇçÿĂăĔĕŸАБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдежзийклмнопрстуфхцчшщъыьэюя

Я удалил буквы Ё и ё, т.к. программа их путает с Ĕ и ĕ.

Рекомендую отредактировать дополнительные свойства языка, нажав на кнопку Дополнительно... (в диалог. окне Свойства языка)

При распознавании текстов в ABBYY FineReader-е бывает много ошибок. Поэтому рекомендую создать пользовательский эталон и провести распознавание текста с его помощью. Для создания пользовательского эталона в меню Сервис, выберите команду Опции…, вкладка Распознавание, поставьте флажок перед Распознавание с обучением. Теперь придется вручную распознать несколько страниц, пока в эталоне не накопиться нужное количество символов.

Перед тем как запустите распознавание, нажав на Распознать все, не забудьте на вкладке Распознавание поставить флажок около Распознавание с пользовательским эталоном и галочку около Использовать встроенные эталоны.

В FineReader 8 есть возможность сохранять документы в PDF формат. Для этого в меню Сервис, ком. Опции... Вкладка 4. Сохранить команда Форматы... Вкладка PDF в выпадающем списке Шрифт... выбирете Использовать системные шрифты и поставьте галочку в опцию Встраивать шрифты

Самый простой вариант, закачать настройки, которые с сделал для FineReader 8 (работают ли они на предыдущих версиях не проверял). Для того, чтобы программа увидела эти настройки, в меню Сервис, команда Опции... Вкладка Общие нажмите на кнопку Загрузить опции... и укажите путь к файлам настроек

Скачать файлы настроек можете по нижеследующей ссылке
http://forum.сhuvаsh.оrg/сgi-bin/ikonboard...=6;t=248;p=3680 (ку ссылки кунтан ĕçлемеç. Кунтан уна  forum.сhuvаsh.  оrg/Сканирование  кĕрсе ил)

Проблема с ударениями решается очень просто. Проведи вначале распознавание с обучением (про обучение эталона в справочнике есть информация), а затем распознавание с пользовательским эталоном. Отправляю файл пользовательского эталона и чувашского языка для Fine Reader-а, созданного мной для распознавания Чӑваш чӗлхи. Энциклопеди словарӗ и Сергеев Л.П., Васильева Е.Ф. Русско-чувашский словарь. В пользовательском эталоне есть символы под знаком ударения. Можешь просмотреть через команду Редактировать… в окне Редактор эталонов. После того как я назначил им символы без ударения, то слова с ударениями были распознаны со значительно меньшим количеством ошибок. Для того, чтобы эталон и язык был найден FR, их надо закинуть в распознаваемый пакет.



Цитата
После стольких лет я выяснил что в FineReader 6.0 по умолчанию уже есть Чувашский язык....

чтобы его открыть нужно зайти
Tools → Language Editor → Additional Languages → Chuvash
и поставить галочку над чувашским и Чувашский язык появится в основном меню....


Цитата
forum.сhuvаsh. оrg/Чăваш халăх канашлăвĕ сайт / Компьютер таврашĕнче / Сканируем тексты:


Сегодня экспериментировал с FineReader 8 (FR8). Он поддерживает экспорт в AdobeReader6 текстов отформатированных шрифтом Arial Unicode MS.

Наконец-то решены проблемы с отсканированными чувашскими текстами, но файлы получаются слишком уж большими. 4 страницы документа Slovoobrazovatel'nye affiksy.pdf = 578 Kb. Это много… Не удалось даже закинуть на    http://groups.yahoo.com/group/chavashtetele

При экспорте изображений и текста из FR8 в AdobeReader6 я установил следующие опции:

Группа "Формат сохранения"
Формат сохранения (выпадающий список):
Текст под изображением страницы
В данном режиме сохраняется изображение страницы, распознанный текст помещается на невидимый слой под изображением. Таким образом получается документ с возможность поиска по тексту, при этом внешний вид PDF документа практически не отличим от оригинала.

Разрешить теги PDF (для Acrobat 5.0 или более поздней версии) Позволяет добавить в создаваемый PDF документ иформацию о структуре документа: логических частях, иллюстрациях и таблицах.

Качество (выпадающий список) Высокое (создаваемый документ предназначен для печати).

Шрифт (выпадающий список) Использовать системные шрифты (PDF-файл ссылается на системные шрифты, установленные на компьютере пользователя, а именно на шрифт Arial Unicode MS. В противном случае Вы не сможете просмотреть распознанный текст (ком. Reflow)).

На компьютере обязательно должен быть установлен шрифт Arial Unicode MS.

В AdobeReader6 для просмотра текста, распознанного в FR8, в меню View (Вид) выбирите ком. Reflow (переформатировать текст). Затем этот текст можно выделить (меню. Edit, ком. Select all), скопировать в буфер обмена (меню. Edit, ком.Copy) и вставить в текстовый редактор для дальнейшего редактирования.

Чем мне понравился режим «Текст под изображением страницы» так тем, что теперь в документе AdobeReader можно проводить поиск слова в тексте и результаты поиска будут показываться на изображении.

Нашел проблему. В AdobeReader админовская раскладка (правый Alt + …) не работает (в поисковике). МШ-па, нужно думать над новой раскладкой, которая бы поддерживалась и AdobeReader/Acrobat

P.S. вроде я уже создавал тему с подобным названием несколько месяцев назад, но теперь найти её не смог. 2Admin: Неужели удалил? Для новичков там же столько интересной инфы было...


Сообщение отредактировал Сканер - Aug 25 2009, 02:27
Profile CardPM
  0/0  
Сканер
post Aug 25 2009, 01:53 
Отправлено #6


Активный

Сообщений: 1 160



Cuneiform Forum : Чувашский язык
http://openocr.org/forum/viewtopic.php?f=4&t=97

Пĕлмес ха , ĕçлети халь чăвашла ку програми? sad.gif

Сообщение отредактировал Сканер - Aug 25 2009, 02:24
Profile CardPM
  0/0  
Takam
post Sep 16 2009, 23:00 
Отправлено #7


какой уж там статус...

Сообщений: 2 049
Из: Мускав хули



unsure.gif Кто-нибудь мог бы разместить тут цветные книжки для детей на чувашском?

--------------------
Вообще-то я белый и пушистый, но очень больно кусаюсь!
Profile CardPM
  0/0  
Takam
post Sep 30 2009, 22:28 
Отправлено #8


какой уж там статус...

Сообщений: 2 049
Из: Мускав хули



Колобок какой-нибудь есть у кого-нибудь? Если есть возможность, разместите сканы детских книжек. Лучше цветные. Думаю, что многим пригодится.

--------------------
Вообще-то я белый и пушистый, но очень больно кусаюсь!
Profile CardPM
  0/0  
lamita
post Sep 30 2009, 22:36 
Отправлено #9


всегда иди дорогою добра

Сообщений: 13 454



Цитата(Takam @ Sep 17 2009, 00:00)
unsure.gif Кто-нибудь мог бы разместить тут цветные книжки для детей на чувашском?
*



У меня есть пара книг для детей на чувашском. Отсканирую на выходные, раньше вряд ли.

--------------------
To struggle and to search
To find and to not surrender
Посмотри, как мир хорош. Потеряешь, улыбайся, улыбнешься и найдешь.
Profile CardPM
  0/0  
Sargay
post Sep 30 2009, 22:40 
Отправлено #10


Саркайăк - Иволга

Сообщений: 9 860
Из: Уйвидек



Цитата(lamita @ Sep 30 2009, 23:36)
У меня есть пара книг для детей на чувашском. Отсканирую на выходные, раньше вряд ли.
*

Было б классно...

Кто знает, где продаются учебники чувашского для младших школьников? Хочу приехать и купить...
Profile CardPM
  0/0  
lamita
post Sep 30 2009, 22:48 
Отправлено #11


всегда иди дорогою добра

Сообщений: 13 454



Цитата(Sargay @ Sep 30 2009, 23:40)
Кто знает, где продаются учебники чувашского для младших школьников? Хочу приехать и купить...
*


В Бибколлекторе на Петрова покупала разговорник Скворцова, для школы посоветовали. А до этого этого же автора брала словарь для начальных классов. Думаю, с книгами на национальном языке в этой же республике проблем быть не должно.

Кстати, часто книги на чувашском сегодняшних писателей продают в музеях (национальном, краеведческом). Мы вот как-то удачно зашли, выставка народных мастеров была (книги, иконы, картины)

Плюс ниже дома Мод (в сторону Красной площади) есть книжное издательство, там тоже частенько выставляют во время праздников на улице книги на чувашском и о Чувашии. Во внутрь не заходила, поскольку книги о Чувашии по той тематике, которые нужны мне, они не печатают. Пойду в Дом печати.


зы: зашла в Книжные новинки на М.Павлова за тетрадью. Учебники есть, только первый класс еще не завезли.

Сообщение отредактировал lamita - Oct 1 2009, 10:42

--------------------
To struggle and to search
To find and to not surrender
Посмотри, как мир хорош. Потеряешь, улыбайся, улыбнешься и найдешь.
Profile CardPM
  0/0  
MayBee
post Sep 30 2009, 22:54 
Отправлено #12


чудесатая

Сообщений: 3 217



Вот в этом книжном была стойка с книгами местного издательства.

--------------------
Всё приходит. И это придёт. :)
Profile CardPM
  0/0  
Takam
post Oct 1 2009, 12:02 
Отправлено #13


какой уж там статус...

Сообщений: 2 049
Из: Мускав хули



Цитата(lamita @ Sep 30 2009, 23:36)
У меня есть пара книг для детей на чувашском. Отсканирую на выходные, раньше вряд ли.
*

Здорово, ждем с нетерпением.

--------------------
Вообще-то я белый и пушистый, но очень больно кусаюсь!
Profile CardPM
  0/0  
lamita
post Oct 2 2009, 16:13 
Отправлено #14


всегда иди дорогою добра

Сообщений: 13 454



Ловите

Присоединённые файлы
Присоединённый файл  Сене_Парне.pdf ( 1,89мб ) Кол-во скачиваний: 367


--------------------
To struggle and to search
To find and to not surrender
Посмотри, как мир хорош. Потеряешь, улыбайся, улыбнешься и найдешь.
Profile CardPM
  0/0  
ned
post Oct 2 2009, 16:17 
Отправлено #15


аптраман тавраш

Сообщений: 10 774



lamita, тав сире!
-----------
lamita, спасибо!
Profile CardPM
  0/0  

2 Страницы  1 2 >
ОтветитьTopic Options
1 чел. читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
Быстрый ответ
Кнопки кодов
 Расширенный режим
 Нормальный режим
    Закрыть все тэги


Открытых тэгов: 
Введите сообщение
Смайлики
smilie  smilie  smilie  smilie  smilie 
smilie  smilie  smilie  smilie  smilie 
smilie  smilie  smilie  smilie  smilie 
smilie  smilie  smilie  smilie  smilie 
smilie  smilie  smilie  smilie  smilie 
smilie  smilie  smilie  smilie  smilie 
         
Показать все

Опции сообщения