Palm (Pilot)
Клуб пользователей, Санкт-Петеpбуpг
 ENLiGHT Project. Новости об информационных технологиях, науке, авиации и космонавтике

ENLiGHT Project

оглавление | новости от ib/news | другие проекты | www.palmgear.com | письмо | win koi lat

Программы для чтения текста

Одно из применений Palm компьютеров - чтение текста. Несмотря на некоторые неудобства связанные с дисплеем, это вполне возможно (как показывает практика). Самым популярным форматом на Palm является формат Doc (он конечно не имеет ничего общего с .doc файлами WinWord'a). Для того чтобы закачать на Palm файлы в этом формате, необходимо воспользоваться программой типа MakeDocW (MakeDoc) которая запускается на PC (например под Windows) и преобразует обычный текстовый файл (в том числе русский, в кодировке cp1251) в .pdb файл который автоматически закачивается на Palm при очередном HotSync'e и выглядит на нем как Doc.
Более удобная - WinMakezTxt.

Есть несколько программ читающих этот формат - TealDoc, AportisDoc, iSilo, RichReader, а также большинство редакторов.
Возможно вам поможет программа ClearTXT (гибкое преобразование текста в html/xml с автоформатированием).
Полезно знать, что Doc и некоторые другие форматы могут немного сжимать файл, причем на русских текстах это не так эффективно, как на английских.

Сравнение (русский текст, html с lib.ru /т.е. практически txt/):

html  plucker % iSilo(2) % DOC %
191k 85k 44 94k 49 147k 77
301k 133k 44 148k 49 232k 77
185k 82k 44 91k  49 143k 77

Да, обычный PalmDOC формат вообще далек от идеала и по части сжатия англ. текстов, хотя их жмет лучше русских. "k" в таблице не настоящие, а десятичные и примерные :)

Plucker
Plucker RichReader TealDoc CSpotRun

Часто бывает удобно или даже необходимо перенести документ на Palm с сохранением форматирования, картинок, выделения шрифтом. К примеру RichReader может преобразовать .rtf/.html файл в свой формат и затем его просматривать.

iSilo - он позволяет переносить на Palm .html файлы (программой SDocSilX, iSiloXC - это iSilo 3.x, или ToGoToGo - iSilo 1.x/2.x), причем на несколько уровней вглубь, со ссылками и картинками. Опять же, - для этого используется его собственный формат. Поддерживает большой экран Handera 330, Sony CLIE, цветные экраны.
в iSilo 3 есть iSiloXC - программа конвертации для интерфейса командной строки (CLI).
ToGoToGo - iSilo 1.x, 2.x
SDocSilX - iSilo 3.x

iSilo 3 на Sony CLIE7xx
(сайт преобразованный в формат iSilo при помощи iSiloXC)

Как готовить книги для чтения:

1) Качаем книгy с lib.ru. ВАЖHО: нyжно качать именно тхт ваpиант. Если кто не знает, то если дописать .gz к имени файла с книгой, то вам бyдет закачен сжатый gzip'ом текст. Без всяких вставок пpо "оцените этот текст" и пpочего хлама.

2) Далее, нам понадобится замечательная пpогpамма TXT2MB, котоpyю всегда можно найти по адpесy http://airbase.uka.ru/computers/pv/txt2mb/

3) Разаpхивиpовав полyченный файл с книгой, натpавливаем на него txt2mb

4) Загpyжаем полyченный полyфабpикат в FAR editor (imho, ничего yдобнее и пpоще не найти) и pyками вносим небольшие испpавления: пpи помощи фyнкции replace all yбиpаем двойные пpобелы (заменy " " на " " надо сделать несколько pаз), yбиpаем двойные тиpе (земенy "--" на "-" делаем 1 pаз). Потом yбиpаем все <i>, <b>, </i>,</b> и т.п. Убиpаем спецзнаки начала и конца заголовков (в FAR вы их сpазy yвидете). Как пpавило, этого достаточно.

5) Обpабатываем полyченный файл с помощью iSilo32C (не забыв пpи помощи ключа -i сфоpмиpовать пpавильный заголовок).

6) Для полного счастья выключаем в опциях iSilo "Показывать scrollbar".

Конверторы из TXT в PDB, умеющие работать из командной строки: Как минимум - makeztxt, Pyrite Publisher, txt2pdbdoc

Plucker - конкурент iSilo. Не умеет читать Doc. Можно выставить разный скроллинг - и как приклеенный, и тапами по экрану, и автоскролл (регулируется в широких пределах - от попиксельной до постраничной прокрутки), причем скорость можно менять на ходу как экранными кнопками, так и простыми росчерками графити (вверх, вниз, влево, вправо - на них вообще можно любое действие подвесить). Это очень удобно как при убранном меню-баре, когда весь экран под текст отдается, так и просто так, когда распробуешь. Hу и почти стандартное уже - все хардверные кнопки можно задействовать при желании.

Сравнение Plucker и iSilo:

iSiloWeb настроил один раз в самом начале и максимум, что меняю для URL'а, копируемого туда -- изредка включаю картинки или изменяю глубину сканирования.
И после того, как соорудит, удаляю эту строчку (или не сохраняю .icl при выходе). Все то же самое доступно и легко проделывается в history либо файл-менеджера, либо plucker-build'а.

Если сохранять линки как каналы и грабить регулярно -- тоже совсем мало разницы, что сделать paste в iSiloWeb, что скопировать одну строчку в текстовом файле и изменить там URL. Database в plucker'е (аналоги .icl в iSiloWeb) -- то, о чем ты говорил в прошлом письме, - плодятся с завидной легкостью, не сложнее, чем Ctrl-N в iSiloWeb. Т.е. задача одноразовая и редкая. Я никакой сколько-нибудь ощутимой разницы не вижу и здесь.

Я не говорю, что все одинаково, но мне кажется, совершенно аналогично. Меня наоборот порадовало отсутствие гуевой морды и упор не такстовые конфиги - их редактирование автоматизировать гораздо легче, если возникнет необходимость. А морда - если понадобится кому-нибудь, напишут, будет текстовые конфиги править. Делов-то.

iSilo (слева 2.58, правее - 3.0)

Также следует отметить, что программы предназначенные для редактирования иногда уникальны в качестве читалок. Например, MegaDoc и Documents2go позволяют читать на Palm предварительно преобразованные .doc файлы формата WinWord (в комплект входят конвертеры).

Если у вас мало свободной памяти, а требования к читалке скромны, можно попробовать CSpotRun Doc Viewer.
Почти все перечисленные программы умеют ставить букмарки, переходить на произвольное место в тексте, удалять файл, менять шрифт (стандартный, жирный, большой итп). Некоторые поворачивают текст на 90-180 градусов.

  MobiPocket Reader (US)  
GutenPalm MobiPocket Reader  

Про Weasel ( GutenPalm ):

Характеристики:

1) Жмет текст с помощь ZLIB (грубо говоря зипом)
2) скролл с помощь клавиатуры и тапов, автоскрол,
3) поиск, букмарки
4) повороты экрана
5) размеры шрифтов
6) менеджер текстов
7) автор доступен :-)
8) исходники есть ...
9) умеет читать книжки сразу на внешних носителях (MemoryStick и т.п.)

GutenPalm 55k
zLIB 30k

Книжка, пример, "Планета обезьян" original: 305075 compressed: 152735

Еще отзыв:

Что понравилось:
- Шустрый. Прямо как iSilo 2.58. Hовая исила в этом отношении не блещет.
- Индикатор позиции вкупе с прогресс-баром смотрятся действительно хорошо.
- Хорошо работает с файлами на карточке памяти. Исила при открытии немного думает, а веасел сразу открывает.
- Гибкие настройки отображения. Поворот экрана, межстрочный интервал, параметры скроллинга.
- Режим justify. Правда, нафига он при этом растягивает еще и заголовки? Это омрачает восторги.
- Часики. Hекритично, но приятно.
- Всего 80 кб, прямо как старая исила. ;-)
- Общие положительные ощущения. Добротный такой немецкий продукт. ;-)

Что не понравилось.
- Сжатие не лучше, чем у исилы. Хотя я уже потом вспомнил, что в документации видел ключик -z2 для большего сжатия. Так что это я наверное прохлопал. Кстати, насколько это тормозит его работу при чтении?
- Hет индикатора, показывающего положение текста (память/карточка). Лазить для этого в Info неудобно.
- Конвертилка все же не всегда корректно обрабатывает диалоги. Hе есть хорошо.
- Самое главное - нет поддержки html. Это самый крупный недостаток. В исилу я всегда конверчу из html, получаются отличные книжки и не нужно заморачиваться с форматированием. Да и таблицы с картинками опять же... Да и док много идет в html.

Результат: Остаюсь на исиле. Если в weasel сделают таки поддержку html, то очень вероятно, что перейду на него. А пока... Hо во всяком случае, он мне понравился куда больше, чем plucker.

MobiPocket Reader - Это и читалка и книг, и новостей, и интегрированный интерфейс со словарями. И по объёму не то, чтобы очень много.

Haali Reader - Умеет читать прямо из обычного ZIP-архива.


Что касается возможностей читать .pdf (.ps) файлы, то полноценного решения пока нет (да и вряд ли будет - учитывая низкое разрешение экрана и слабый процессор в машинках на PalmOS <5). Частично проблему можно решить преобразовывая на большом компьютере .pdf в .txt , doc или промежуточный формат который затем можно читать на Palm:

pdftotext из комплекта xpdf (и еще ссылка) - Преобразует документ из .pdf в текст. Вероятно это лучший конвертер.
AportisDocPdfConverter - Преобразует текст из .pdf в Palm Doc (также доступен здесь)
http://www.pdfzone.com/index.asp - PDF Zone (различные вспомогательные средства и конвертеры)
http://bcl-computers.com - Plugin'ы к Acrobat Reader'y для преобразования PDF в html, rtf и т.д. Не работают с русским текстом.
http://cooler.emax.ru/numbers_one/55.emax#id_479 - Как преобразовать PDF в нормальный русский текст?
http://vedi.d-s.ru/faq/pdf_text.htm - еще несколько слов по этому поводу
http://www.adobe.com/products/acrobat/readerforpalm.html - "Adobe Acrobat Reader" for PalmOS

Adobe Acrobat Reader for PalmOS

Есть еще неплохой (но медленный и не такой удобный) вариант - Fine Reader 6 (корпоративная версия) умеет загружать .PDF файлы.

Для преобразования pdf в html:

http://sourceforge.net/projects/pdftohtml
http://www.pdfzone.com/toolbox/tool_WinPDFdata.html
http://www.ansyr.com/products/palm/pdfsnap15/default.asp
http://www.adobe.com/products/acrobat/access_adv_form.html
http://www.gohtm.com/
http://pdftohtml.sourceforge.net/

http://www.verypdf.com - хороший конвертер англоязычных текстов из pdf в bmp/html

Еще, для чтения .chm полезен конвертер - www.chm2web.com

Repligo - преобразует на PC документы в самых разных форматах и затем позволяет читать их на Palm. Вероятно, результат представляет собой картинку с соответствующими плюсами и минусами.

RepliGo
Repligo

Узнать для чтения какой программой предназначен .pdb файл можно если посмотреть в его первые ~80 байт. Там начиная с байта 60 идет строчка которой соответствуют например следующие программы:

DataPlkr - Plucker
BVokBDIC = BDicty 
TEXtREAd = DOC 
DB99DBOS = DB (Database program) 
vIMGView = FireViewer/ImageViewer 
PmDBPmDB = HanDBase 
InfoINDB = InfoView 
ToGoToGo = iSilo 
JbDbJBas = JFile 
JfDbJFil = JFile Pro (no longer used) 
DATALSdb = LIST 
Mdb1Mdb1 = MobileDB 
PNRdPPrs = Peanut Reader 
DataSprd = QuickSheet 
TEXtTlDc = TealDoc 
InfoTlIf = TealInfo 
DataTlMl = TealMeal 
DataTlPt = TealPaint 
dataTDBP = ThinkDB 
TdatTide = Tides 
ToRaTRPW = TomeRaider


Преобразовать .pdb файл (Doc) обратно в текст можно при помощи макроса для WinWord'a "WordDocConvert"


Энергопотребление при чтении разными читалками (измерения Петра Сучкова):

Короче, вот сводная табличка по читалкам, с которыми я дело имел :) Установлены
батарейки, напряжение 2.95 или аккумуляторы, напряжение 2.54V. Данные по
размерам в памяти взяты с palmgear.

Hазвание  Версия Занимает в палме Потребляет при 2.95V Потребляет при 2.54V

iSilo

3.15

321K

89.1mW

(30.2mA)

104.1mW

(41.0mA)

Weasel

1.59.2

80K

95.9mW

(32.5mA)

117.6mW

(46.3mA)

CSpotRun

1.2.4

28K

77.6mW

(26.3mA)

90.7mW

(35.7mA)

ReadThemAll

1.81

30K

79.7mW

(27.0mA)

90.4mW

(35.6mA)

RichReader

1.62

123K

79.7mW

(27.0mA)

90.4mW

(35.6mA)

QvadisLite

2.0.1

90K

90.9mW

(30.8mA)

109.2mW

(41.5mA)

MemoPad

4K

:)

77.6mW

(26.3mA)

88.9mW

(35.0mA)

Пояснения. Столь неожиданные результаты я объяснить сразу не могу. Во-первых,
потребляемая пальмом мощность зависит от напряжения источников. А во-вторых
наблюдается интересный эффект - при запуски любой читалки потребляемый ток выше
(иногда - значительно) указанного в таблице. Через некоторое время (секунд
5-20, по-разному) ток падает и далее остается неизменным, обнаруживая всплески
лишь при нажатии клавиш. Так вот, именно это, стартовое значение и принял я в
прошлый раз за основу. Hапример, для iSilo в первом случае ток падает с
50.3mA(!) до 30.2. А во втором - с 72.8(!) до 41. Возможно в начале работы
производится какая-то обработка текста, распаковка и так далее... правда
странно - я тестировал для всех ридеров один обычный текст, который понимали
все, не сжатый. Кстати, единственным ридером без данного эффекта является RTA -
у него в обоих режимах (прокрутка/пауза) значение тока практически неизменно.

Мораль: сильно по потреблению тока ридеры не отличаются, посему имеет смысл
обратить внимание на их сервисные функции :) Что-то мне стал нравиться CSpotRun
(можно настроить самый маленький интервал и поместить больше текста на экран,
удобная вертелка экрана, быстр и очень мало места ест)... эх, если бы еще он
все форматы сразу понимал. Hу и потребляет меньше всех :)

И еще мнение другого человека :

Я на своей Хандеpе меpял: iSilo потpебляло 50 мА на 22 МГц, Weasel потpеблял 20-22 мА, в момент смены стpаницы кpатковpеменно подскакивал до 40-45 мА. Это одна из пpичин, по котоpым я yшел с iSilo.


Вариант преобразования из html в txt:    lynx -dump -nolist your_url > file.txt

можно добавить -width=8000 чтобы получать "один абзац - одна строка" (удобно для makeztxt режим -a2 -- не будет проблем с диалогами)

 

Если вы хотите дополнить FAQ - пожалуйста пишите. Ваши вопросы и ответы по e-mail могут быть помещены в форум или опубликованы в FAQ.

design/collection/some content by Frog,
PALM FAQ (C) Frog 2000-2003,
"PALM FAQ, http://www.enlight.ru/pilot/".

 

ENLiGHT Project. Новости об информационных технологиях, науке, авиации и космонавтике