Old-Web.com
 
Вернуться   Форум о старом интернете > Другое, прочее, остальное... > Обсуждение Old-Web
Регистрация Справка Пользователи Календарь Поиск Сообщения за день Все разделы прочитаны

Закрытая тема
 
Опции темы Опции просмотра
Старый 09.01.2025   #1
danil
Администратор
 
Аватар для danil
 
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 707
По умолчанию Обсуждение концепции свой поисковой системы

Я пользовался API от поиска Google все это время для поиска на old-web. На самом деле ни Google ни Яндекс не ищет на сайтах которые мне нужны. Этим поисковым системам выгодно показывать сайты с уже большим трафиком, а маленькие сайты, на которых есть нужный мне контент вообще исключены из поиска. Таким образом, ни Google ни Яндекс не подходит для внедрения на old-web.
__________________
Я вернул двухтысячные!
danil на форуме  
Старый 09.01.2025   #2
danil
Администратор
 
Аватар для danil
 
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 707
По умолчанию

Изначально я хотел индексировать только сайты из каталога, но передумал. Только одно ограничение оставлю, сайт должен быть доступен без https, тут-то все современные соц. сети и прочие платформы сами отвалятся.
__________________
Я вернул двухтысячные!
danil на форуме  
Старый 09.01.2025   #3
danil
Администратор
 
Аватар для danil
 
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 707
По умолчанию

На данный момент индексация сайтов проходит успешно. Процесс будет идти постоянно, пополняя поиск новыми страницами.

Чувствую себя первопроходцем из 2000х )) Отдельный поисковой сервер для http сайтов, который индексирует весь видимый веб. Как и ожидалось, веб больше, чем нам показывает Google и Яндекс. Может позже отдельный сайт поисковик открою, для всех языков, чтобы все могли искать через него http web.
__________________
Я вернул двухтысячные!
danil на форуме  
Старый 10.01.2025   #4
dsalin
Пользователь
 
Аватар для dsalin
 
Регистрация: 02.12.2024
Сообщений: 39
По умолчанию

Пожалуйста, поделитесь как вы это организовали?
dsalin вне форума  
Старый 10.01.2025   #5
danil
Администратор
 
Аватар для danil
 
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 707
По умолчанию

Цитата:
Сообщение от dsalin Посмотреть сообщение
Пожалуйста, поделитесь как вы это организовали?
Арендовал облачный Ubuntu сервер, установил опенсорсный поисковой движок Yacy, версию для Linux. Когда проиндекирую достаточно большую часть веба на http, внедрю поисковую строку на своих сайтах, сделаю отдельный сайт чисто с поисковой строкой, сделаю конструктор виджета, чтобы поисковую форму можно было установить на любом сайте.

В принципе, он будет не хуже, чем первые поисковики. Все равно альтернативных поисковиков не так много. Если смогу индексировать за год сотни миллионов http страниц, то это будет полноценный поисковик в своей нише, который чисто в http ищет.

Сообщество продолжает дорабатывать этот движок, так, что с безопасностью не должно быть проблем.

Есть поиск по картинкам, автозаполнение и прочие привычные для современных поисковиков штуки.
__________________
Я вернул двухтысячные!
danil на форуме  
Старый 11.01.2025   #6
danil
Администратор
 
Аватар для danil
 
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 707
По умолчанию

Уже проиндексировано более 200 000 страниц. Что капля в море, продолжаю индексацию. На днях поставлю форму поиска новую на сайте, перейдем на свою поисковую базу.
__________________
Я вернул двухтысячные!
danil на форуме  
Старый 14.01.2025   #7
danil
Администратор
 
Аватар для danil
 
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 707
По умолчанию

В индексе уже 1,003,835 страниц. Внедрение нового поисковика на old-web уже скоро.
__________________
Я вернул двухтысячные!
danil на форуме  
Старый 23.01.2025   #8
danil
Администратор
 
Аватар для danil
 
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 707
По умолчанию

Знаете что, взглянул я на сайты в индексе и понял, сайтов старых осталось так мало, смысла предлагать вам искать по этим сайтам нет.

Если мне придется содержать поисковой сервер, то мне нужен хотя бы уникальный поисковик. Web архив очень плохо проиндексирован поисковиками, а те поисковики что ищут через API web архива находят только домены архивных сайтов, а не внутренние страницы с нужным контентом.

Я начинаю сначала и буду теперь индексировать Web архив. http://web.archive.org

БОНУСОМ проиндексирую сайты из каталога Old-Web.
__________________
Я вернул двухтысячные!
danil на форуме  
Старый 23.01.2025   #9
dsalin
Пользователь
 
Аватар для dsalin
 
Регистрация: 02.12.2024
Сообщений: 39
По умолчанию

Цитата:
Сообщение от danil Посмотреть сообщение
Арендовал облачный Ubuntu сервер, установил опенсорсный поисковой движок Yacy, версию для Linux. Когда проиндекирую достаточно большую часть веба на http, внедрю поисковую строку на своих сайтах, сделаю отдельный сайт чисто с поисковой строкой, сделаю конструктор виджета, чтобы поисковую форму можно было установить на любом сайте.

В принципе, он будет не хуже, чем первые поисковики. Все равно альтернативных поисковиков не так много. Если смогу индексировать за год сотни миллионов http страниц, то это будет полноценный поисковик в своей нише, который чисто в http ищет.

Сообщество продолжает дорабатывать этот движок, так, что с безопасностью не должно быть проблем.

Есть поиск по картинкам, автозаполнение и прочие привычные для современных поисковиков штуки.
Спасибо за ответ!
dsalin вне форума  
Старый 23.01.2025   #10
danil
Администратор
 
Аватар для danil
 
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 707
По умолчанию

Начал индексировать веб архив, установил фильтр, чтобы индексировал начинаю с 1996 по 2006 включительно. Скорость веб архива очень мала, удается индексировать до 20 страниц в минуту. Процесс ожидается очень долгий.

В архиве есть миллионы старых сайтов и на них сохранилось бессчётное количество информации и файлов. И все это доступно в http, даже на старых браузерах.

Разница между сохранившимися сайтами в архиве и теми сайтами что до сих пор онлайн + наши с вами сайты, это небо и земля.

Дожидаться более 1 000 000 индексированных страниц нет смысла, это займет несколько месяцев. Уже через несколько дней я вставлю новое поле поиска по веб-архиву.

БОНУСОМ проиндексирую сайты из каталога Old-Web.
__________________
Я вернул двухтысячные!
danil на форуме  
Закрытая тема


Здесь присутствуют: 2 (пользователей: 0 , гостей: 2)
 
Опции темы
Опции просмотра

Ваши права в разделе
Вы не можете создавать темы
Вы можете отвечать на сообщения
Вы не можете прикреплять файлы
Вы не можете редактировать сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.
Быстрый переход

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Обсуждение Wayback Machine (Archive.org) danil Сайты 2 20.01.2025 05:19
old-soft как попытка сделать свой сайт HellCat Зацени сайты форумчан 3 14.07.2024 16:01


Часовой пояс GMT, время: 20:20.


Powered by vBulletin® Version 3.6.12
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd. Перевод: zCarot