агент читателя

во многих разных фантастических книжках и фильмах компьютер персонажа действует самостоятельно, изучая данные в сети и отбирая из них то, что нужно его владельцу. Иными словами, компьютер там работает как доверенный агент человека, почти не обременённый интеллектом, но способный на самостоятельность. К сожалению или к счастью, в реальном мире обычные люди практически не используют компьютеры таким образом.

некоторое приближение к фантастике можно увидеть в том, как программы-аггрегаторы обходят сайты, на которые подписан владелец, и собирают с них обновления в виде atom/rss. Однако самостоятельности тут почти нет: я не знаю программ, которые хотя бы переходили по ссылкам в потоках, не говоря уже о ссылках второго уровня. Вроде бы есть аггрегаторы, которые могут показать не взятый из atom/rss текст, а страницу, на которую он ссылается, но обычно результат от этого становится только хуже: на странице практически всегда присутствует очень много лишних элементов. Хотя понятно, что таким образом они пытаются решить проблему «в atom/rss присутствует только анонс текста».

поскольку у меня есть браузер с широкими возможностями пользовательских скриптов и, по сути, собственная читалка atom/rss, ничто не помешало мне разобраться с этой проблемой любимым способом. Читалке я сказал, какие потоки содержат только анонсы. За один вечер я научил её открывать ссылки из этих потоков в ифреймах, вынимать из загруженных страниц интересующие меня теги (для каждого сайта — свой css-селектор), и показывать их прямо в интерфейсе читалки вместо анонсов. Получился примитивный агент, выбирающий для меня только нужный мне текст вопреки огораживанию

кстати, на очевидное возражение «сайтам тоже нужно зарабатывать» контраргумент настолько же очевиден: «компьютер должен служить своему хозяину»

Артемий Трегубенко,
,

comments powered by Disqus