Как превращать сайты и новости сайтов в полноценные электронные книжки

08.02.2012 27541   Комментарии (27)

У каждого пользователя есть определенный набор сайтов, которые он посещает ежедневно или с какой-то периодичностью. Новости, анекдоты, любимые блоги, сообщества - и так далее и тому подобное. Однако далеко не всем нравится в течение дня по много раз заходить на любимые сайты, чтобы посмотреть, не появилось ли там что-нибудь новенькое.

Но заходить на самом деле и не надо! Для информирования пользователей о том, что на сайте появился новый выпуск, придумана технология RSS, с помощью которой вы можете вовремя получать новые выпуски (анонсы этих выпусков) в свой почтовый клиент или в браузер.

Сейчас RSS - крайне востребованная и популярная технология. Ее поддерживают все браузеры и большинство популярных сайтов. Заходите на какой-то интересный сайт - смотрите на правую часть адресной строки: как правило, если сайт поддерживает трансляцию RSS, браузер покажет вам специальный значок, с помощью которого можно подписаться на обновления этого сайта.


Значок подписки на RSS

Для чтения RSS, на мой взгляд, удобнее всего использовать Google Reader или получать их в почтовый клиент (тот же Outlook, например). Для мобильных платформ - планшеты, телефоны - существуют самые разные клиенты для различных платформ. На iPad лично я использую Feedler RSS Reader, для iPhone - MobileRSS, для планшетов-телефонов на Android - BeyondPod.

Однако при использовании RSS тоже есть определенные неудобства. Они оба связаны с использованием RSS-лент в ситуации, когда отсутствует подключение к Интернету. Первое - невозможность получить новые (или, наоборот, старые обновления). Любой RSS-агрегатор скачивает ограниченное количество записей RSS-ленты - например, 10 или 20 последних. (Это обычно настраивается.) И если вы прочитали последние обновления, но хотите почитать старые обновления, которые вы еще не видели, получить их вы не сможете.

Второе неудобство - если сайт отдает в RSS-ленту только анонсы статей (как правило, это несколько первых абзацев), а не сами статьи, то без подключения к Интернету вы эти статьи и не увидите. А читать одни анонсы - занятие совершенно бессмысленное.

Как решать данную проблему? Как получить статьи нужного вам сайта в таком виде, чтобы это спокойно можно было читать, например, в дороге без всякого подключения к Интернету?

Оказывается, есть совершенно бесплатный сервис, который эту задачу решает довольно успешно. Я сам о нем узнал совсем недавно - разработчики прислали ссылку ознакомиться - и теперь его использую постоянно.

Сервис называется Newstoebook.


Newstoebook

Работает эта система очень просто. Предположим, вы хотите почитать по дороге на работу мои обзоры всяких гаджетов из раздела "Обзоры".

Заходите на Newstoebook и в строке с надписью RSS вводите адрес раздела - www.exler.ru/expromt. (Тут также можно ввести напрямую адрес RSS-ленты - http://www.exler.ru/rss-expromt.xml, ссылка на которую есть в адресной строке и в правой колонке раздела, также можно вводить ссылку на другую ленту, если на странице представлено их несколько.)

Адрес ввели, нажимаете на кнопку, расположенную справа от строки.

Если сервис находит ленту, то он вам демонстрирует последние несколько заголовков.


Найденная лента

Теперь вам остается нажать кнопку Get EPUB, чтобы получить файл в самом распространенном формате электронных книг EPUB, либо же кнопку Get KINDLE, чтобы получить файл в формате MOBI, - специально для ридеров Kindle.

EPUB можно читать практически на всех ридерах (кроме Kindle) и всех планшетах-телефонах.

После выбора нужного формата возникает вот такое окно с опциями.


Опции

Опцию Sort articles chronologically нужно включать только в том случае, если вы хотите, чтобы в документе сначала шли старые статьи (иначе, как на сайте, сначала будут идти более новые). Опцию Get full text contents обязательно нужно включить, чтобы сервис мог вытащить с сайта полный текст статьи, если в RSS дается только начало статьи со ссылкой "далее" (вот как у меня).

Embed font - это задание конкретного шрифта для отображения текста в документе EPUB, но это имеет смысл включать только в случае каких-то проблем при использовании опции none.  Я не включал никакие шрифты, все отображалось нормально.

После этого при нажатии кнопки "ОК" начнется конвертация, по окончании которой вам будет предложено сохранить получившийся документ - да хоть прямо в ридер-планшет-телефон, если они подключены к компьютеру. (На iPhone/iPad с компьютера книжечку загрузить не через iTunes не так уж и просто, но если Newstoebook открывать прямо с них, то уже никакие компьютеры и iTunes не понадобятся - созданная книжка будет закачана прямо в iPhone/iPad.)

Ну и все, далее остается открыть получившийся документ.

Давайте посмотрим, как это все выглядит в итоге. Я сгенерировал файл из моих обзоров всяких гаджетов, которые в RSS отдаются в виде анонсов со ссылкой "далее", то есть без полного текста статьи. (При щелчке по уменьшенным скриншотам будет появляться полноразмер.)

Так это все выглядит в айпэде.


Содержимое и начало статьи


Текст статьи

По-моему, смотрится просто прекрасно! Система очень аккуратно переверстывает статьи в книжный формат, попутно сжимая иллюстрации, чтобы это не вызывало проблем при чтении. 

Содержание с гиперссылками выводится в самом начала документа, также оно доступно по кнопке "Содержание".

В iBooks сначала наблюдались некоторые проблемы с выводом текста, в котором находились иллюстрации с обтеканием, - это было связано с особенностями реализации движка EPUB именно в iBooks. Но после переписки с создателями сервиса эти проблемы удалось побороть.


Моя кинорецензия

При этом в других ридерах под iPad - например, в Stanza - никаких проблем изначально не было. 

А вот так это все выглядит в ридере - на примере Sony PRS-350.


Заголовок документа с рецензиями



Начало рецензии

Вот так выглядит файл, сделанный из анонсов RSS Iphones.ru - c вытащенными целиком статьями.


Статьи на iPhones.ru

Ну и вот, например, RSS-лента журнала "Огонек".


Журнал "Огонек"

На мой взгляд, просто здорово! В течение пары минут можно получить в виде отдельного файла набор статей любого интересующего вас сайта с RSS (даже если там только анонсы со ссылкой на продолжение), после чего файл остается сохранить на ваше устройство (ридер, планшет, телефон) - и все, он готов к прочтению.

Кстати, Newstoebook также работает и с Google Reader - вы можете ввести данные своего аккаунта, и сервис предложит сформировать книжки по любым из выбранных подписок.


Подписка Google Reader

Однако здесь есть и определенная тонкость: из обычных папок с подпиской Google Reader сервис не умеет вытаскивать полные статьи из анонсов со ссылкой на продолжение. Однако если в Google Reader создать папку expand и туда поместить подписки с анонсами, которые нужно скачивать целиком - Newstoebook их будет скачивать целиком. 

Вот такой удобный и полезный сервис. Конечно, его есть куда развивать. Для пользователей, которые к нему будут обращаться постоянно, имеет смысл создать личные кабинеты и там хранить ссылки на нужные RSS-ленты, чтобы в любой момент по щелчку получать файлы со свежими обновлениями. Впрочем, и без этого вполне можно пережить, учитывая легкость и быстроту получения документа EPUB по введенному адресу сайта или адресу RSS-ленты.

© 1998–2024 Alex Exler
08.02.2012

Комментарии 27

Действительно, вытягивает только последние пять обновлений, по крайней мере из exler.ru
В целом же сервис классный!
10.03.12 03:13
0 0

Так а как в калибре сделать так, чтобы в ридере текст не выглядел как "?????? ?? ???", т.е. как кириллицу добавить?
09.02.12 11:56
0 0

Подобным может заниматься и Calibre, правда там с Python'ом надо немного повошкаться, чтобы соотв. скрипт написать.
08.02.12 22:26
0 0

chewi:
Подобным может заниматься и Calibre, правда там с Python'ом надо немного повошкаться, чтобы соотв. скрипт написать.




Не, он и без питона справляется (если в advanced настройки не лезть). Причем сделал mobi на 7 мегов, в отличие от ньюстуeбуковых 12.

Только calibre, похоже, написан каким-то маньяком который отлично знает форматы файлов, но совершенно забил на UX пользователя и страдает навязчивой идеей стащить игрушки с городской елки и запрессовать их все в свой чуланчик метр на метр. Причем вместе с елкой. Ярко, красиво, все в одном месте и фиг разберешься без поллитра.
09.02.12 05:22
0 0

Эх, неплохо бы такое чудо в виде локальной программы... Сайт, он сегодня есть, а завтра его может и не быть...
08.02.12 18:15
0 0

Alex Exler:
... Заходите на какой-то интересный сайт - смотрите на правую часть адресной строки: как правило, если сайт поддерживает трансляцию RSS, браузер покажет вам специальный значок, с помощью которого можно подписаться на обновления этого сайта.




Это не отдельно ставящийся extension в хроме такой значок показывает? У меня (Chrome 16) ни на http://www.iphones.ru/ , ни на http://www.iphones.ru/feed значка (page action иконки RSS) нет.

Сайт, кстати классный - надо эту идею развивать. А то неуклюжесть калибра уже с души воротит.
08.02.12 16:45
0 0



Хром RSS не поддерживает. Только с дополнениями.
13.02.12 23:08
0 0

Отличная штука!

Спасибо, Алекс!

Отдельное спасибо Майло О'Браниган.

Теперь можно рассортировать по папкам, а не ограничиdаться одной папкой "Expand".
08.02.12 12:36
0 0

А в чем профит для сайта?
08.02.12 11:55
0 0

для пробы решил скачать последние обзоры с MR - бодро дошел до 66% и застыл на полчаса уже..
08.02.12 10:59
0 0

alez7:
для пробы решил скачать последние обзоры с MR - бодро дошел до 66% и застыл на полчаса уже..




У меня один раз такое тоже было.
08.02.12 12:43
0 0

В Google Reader создал и поместил новости с заголовками в папку expand, но ничего не произошло. Как были заголовками, так и остались.
08.02.12 10:56
0 0

Shmuckler:
В Google Reader создал и поместил новости с заголовками в папку expand, но ничего не произошло. Как были заголовками, так и остались.




В Google Reader они и будут заголовками. А вот преобразователь вытащит полные тексты.
08.02.12 12:42
0 0

Для "вытягивания" полного текста статей мне лично очень удобно пользоваться сервисом fulltextrssfeed.com/ (их много разных, но я пользуюсь этим)

Он формирует на основе анонса новый RSS фид. Т.е. вводишь www.exler.ru получаешь fulltextrssfeed.com с полным текстом ленты.

С GoogleReader работает.
08.02.12 10:34
0 0

Майло О'Браниган:
Для "вытягивания" полного текста статей мне лично очень удобно пользоваться сервисом fulltextrssfeed.com/ (их много разных, но я пользуюсь этим)

Он формирует на основе анонса новый RSS фид. Т.е. вводишь www.exler.ru получаешь fulltextrssfeed.com с полным текстом ленты.

С GoogleReader работает.




Ценно, спасибо, надо будет попробовать.
08.02.12 12:42
0 0

Алекс, отправил на почту вопрос с просьбой дополнения данной статьи второй частью. Надеюсь напишете.
08.02.12 10:09
0 0

За счет чего окупается сервис?
08.02.12 09:44
0 0

rocket1:
За счет чего окупается сервис?




Это их проблемы. А за счет чего окупается Exler.ru?
08.02.12 12:40
0 0

BeyongPod BeyondPod
08.02.12 09:43
0 0

pirotehnik:
BeyongPod BeyondPod




Спасибо, исправил.
08.02.12 12:41
0 0

Когда-то был MDigger отличным ридером. Умел статьи целиком закачивать. Но в какой-то версии опопсел и перестал это делать.
sgl
08.02.12 09:43
0 0

У меня почемуто google reader в последнее время не хочет работать с сайтом news2.ru

Пишет ошибка обновления. Другие ридеры работаю.. хз что такое.
08.02.12 09:33
0 0

Действительно полезный сервис. Спасибо!

PS. Очепятка в предпоследнем абзаце: "тонкостьс" - или буква лишняя, или дефис пропущен. 😄
08.02.12 09:24
0 0