![]() |
||
![]() |
![]() |
|
![]() |
|
Регистрация | Справка | Пользователи | Календарь | Поиск | Сообщения за день | Все разделы прочитаны |
![]() |
|
Опции темы | Опции просмотра |
![]() |
#1 |
Администратор
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 707
|
![]() Я пользовался API от поиска Google все это время для поиска на old-web. На самом деле ни Google ни Яндекс не ищет на сайтах которые мне нужны. Этим поисковым системам выгодно показывать сайты с уже большим трафиком, а маленькие сайты, на которых есть нужный мне контент вообще исключены из поиска. Таким образом, ни Google ни Яндекс не подходит для внедрения на old-web.
|
![]() |
![]() |
#2 |
Администратор
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 707
|
![]() Изначально я хотел индексировать только сайты из каталога, но передумал. Только одно ограничение оставлю, сайт должен быть доступен без https, тут-то все современные соц. сети и прочие платформы сами отвалятся.
|
![]() |
![]() |
#3 |
Администратор
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 707
|
![]() На данный момент индексация сайтов проходит успешно. Процесс будет идти постоянно, пополняя поиск новыми страницами.
Чувствую себя первопроходцем из 2000х )) Отдельный поисковой сервер для http сайтов, который индексирует весь видимый веб. Как и ожидалось, веб больше, чем нам показывает Google и Яндекс. Может позже отдельный сайт поисковик открою, для всех языков, чтобы все могли искать через него http web. |
![]() |
![]() |
#4 |
Пользователь
Регистрация: 02.12.2024
Сообщений: 39
|
![]() Пожалуйста, поделитесь как вы это организовали?
|
![]() |
![]() |
#5 |
Администратор
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 707
|
![]() Арендовал облачный Ubuntu сервер, установил опенсорсный поисковой движок Yacy, версию для Linux. Когда проиндекирую достаточно большую часть веба на http, внедрю поисковую строку на своих сайтах, сделаю отдельный сайт чисто с поисковой строкой, сделаю конструктор виджета, чтобы поисковую форму можно было установить на любом сайте.
В принципе, он будет не хуже, чем первые поисковики. Все равно альтернативных поисковиков не так много. Если смогу индексировать за год сотни миллионов http страниц, то это будет полноценный поисковик в своей нише, который чисто в http ищет. Сообщество продолжает дорабатывать этот движок, так, что с безопасностью не должно быть проблем. Есть поиск по картинкам, автозаполнение и прочие привычные для современных поисковиков штуки. |
![]() |
![]() |
#6 |
Администратор
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 707
|
![]() Уже проиндексировано более 200 000 страниц. Что капля в море, продолжаю индексацию. На днях поставлю форму поиска новую на сайте, перейдем на свою поисковую базу.
|
![]() |
![]() |
#7 |
Администратор
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 707
|
![]() В индексе уже 1,003,835 страниц. Внедрение нового поисковика на old-web уже скоро.
|
![]() |
![]() |
#8 |
Администратор
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 707
|
![]() Знаете что, взглянул я на сайты в индексе и понял, сайтов старых осталось так мало, смысла предлагать вам искать по этим сайтам нет.
Если мне придется содержать поисковой сервер, то мне нужен хотя бы уникальный поисковик. Web архив очень плохо проиндексирован поисковиками, а те поисковики что ищут через API web архива находят только домены архивных сайтов, а не внутренние страницы с нужным контентом. Я начинаю сначала и буду теперь индексировать Web архив. http://web.archive.org БОНУСОМ проиндексирую сайты из каталога Old-Web. |
![]() |
![]() |
#9 | |
Пользователь
Регистрация: 02.12.2024
Сообщений: 39
|
![]() Цитата:
|
|
![]() |
![]() |
#10 |
Администратор
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 707
|
![]() Начал индексировать веб архив, установил фильтр, чтобы индексировал начинаю с 1996 по 2006 включительно. Скорость веб архива очень мала, удается индексировать до 20 страниц в минуту. Процесс ожидается очень долгий.
В архиве есть миллионы старых сайтов и на них сохранилось бессчётное количество информации и файлов. И все это доступно в http, даже на старых браузерах. Разница между сохранившимися сайтами в архиве и теми сайтами что до сих пор онлайн + наши с вами сайты, это небо и земля. Дожидаться более 1 000 000 индексированных страниц нет смысла, это займет несколько месяцев. Уже через несколько дней я вставлю новое поле поиска по веб-архиву. БОНУСОМ проиндексирую сайты из каталога Old-Web. |
![]() |
![]() |
Здесь присутствуют: 2 (пользователей: 0 , гостей: 2) | |
Опции темы | |
Опции просмотра | |
|
|
![]() |
||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Обсуждение Wayback Machine (Archive.org) | danil | Сайты | 2 | 20.01.2025 05:19 |
old-soft как попытка сделать свой сайт | HellCat | Зацени сайты форумчан | 3 | 14.07.2024 16:01 |
© Old-Web.com - навигатор старого Интернета Пишите мне на email: danil@freenet.am |
|