Главная Мультфильмы Видео Чат Telegram Wareznik Scripter Flash игры
Old Web Старый веб
. Добро пожаловать на old-web.com!
Новое Новости Журнал Форум Продукты Дизайн Гостевая  
Вернуться   Форум о старом интернете > Сервисы > Поисковые системы
Регистрация Справка Пользователи Календарь Поиск Сообщения за день Все разделы прочитаны

Поисковые системы Обсуждаем, как искать правильно: альтернативы, трюки и баги поисковых систем.

Ответ
 
Опции темы
Старый 13.04.2025, 08:04   #1
Администратор
 
Аватар для eriko
 
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 1,442
Вес репутации: 100
По умолчанию Поисковик Old-Web официальная тема

Раз уж у old-web есть свой поиск, то решил создать для него тему в соответствующем разделе.

У нас ищутся старые сайты, без слежки и JS. Как в начале нулевых.

Поисковые операторы работают, например:

1) -
2) +
3) site:
4) кавычки

В индекс пока что 10 лямов страниц. Место на сервере занято 5%, так что можем еще в 20 раз увеличить объем страниц, а это уже будет 200 000 000 страниц.
__________________
Мой блог http://erikoblog.ru.
eriko на форуме   Ответить с цитированием
Старый 13.04.2025, 11:33   #2
Местный
 
Аватар для Шурик
 
Регистрация: 29.01.2025
Адрес: Ереван: Улица Акселя Бакунца, Москва: Улица Губкина, Кр
Сообщений: 86
Вес репутации: 0
Репутация: пока не определён (0)
По умолчанию

20 миллионов! Мне кажется, на старых компах можно old web ставить домашней страницей, и спокойно забывать про остальной интернет
__________________

Назад, в будущее!
Шурик вне форума   Ответить с цитированием
Старый 13.04.2025, 11:40   #3
Администратор
 
Аватар для eriko
 
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 1,442
Вес репутации: 100
По умолчанию

Цитата:
Сообщение от Шурик Посмотреть сообщение
20 миллионов! Мне кажется, на старых компах можно old web ставить домашней страницей, и спокойно забывать про остальной интернет
Пока что есть 10 миллионов страниц, буду идти к цифре 200 миллионов. Но надо понимать, что старый интернет не на столько велик. Мы неизбежно столкнёмся с нехваткой сайтов для индексации.
__________________
Мой блог http://erikoblog.ru.
eriko на форуме   Ответить с цитированием
Старый 03.05.2025, 01:23   #4
Олд
 
Аватар для maninabox
 
Регистрация: 22.04.2025
Сообщений: 203
Вес репутации: 48
Репутация: - весьма и весьма положительная личность (200)
По умолчанию

А что за движок используется?
Смотрю по отзывчивости, он немного туповат, скорее всего нет потоковой индексации, просто делает выборку из базы.
maninabox на форуме   Ответить с цитированием
Старый 03.05.2025, 01:40   #5
Администратор
 
Аватар для eriko
 
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 1,442
Вес репутации: 100
По умолчанию

Цитата:
Сообщение от maninabox Посмотреть сообщение
А что за движок используется?
Смотрю по отзывчивости, он немного туповат, скорее всего нет потоковой индексации, просто делает выборку из базы.
Движок Yacy. Да, туповат. Буду менять в будущем.
__________________
Мой блог http://erikoblog.ru.
eriko на форуме   Ответить с цитированием
Старый 13.05.2025, 14:44   #6
Администратор
 
Аватар для eriko
 
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 1,442
Вес репутации: 100
По умолчанию

Закончил писать скрипт, который будет управлять очередью сайтов, которые нужно индексировать в поисковике Old-Web. Это значит, что не будет больше превышена нагрузка на сервер, из-за чего было невозможно искать, если индексировались сайты.

В том числе, теперь можно будет автоматизировать индексацию, а не вводить руками ссылки для индексации. Это даст возможность увеличить количество сайтов и страниц в поиске в разы.

Добавлено через 2 минуты
Если будет спрос на поиск, то в будущем увеличу для поискового сервера количество RAM и CPU, это увеличит скорость работы поисковика и сделает его более отзывчивым.

Добавлено через 50 минут
Добавил 75000 старых сайтов в очередь на индексацию.
__________________
Мой блог http://erikoblog.ru.

Последний раз редактировалось eriko, 13.05.2025 в 14:44. Причина: Добавлено сообщение
eriko на форуме   Ответить с цитированием
Старый 19.05.2025, 02:06   #7
Администратор
 
Аватар для eriko
 
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 1,442
Вес репутации: 100
По умолчанию

Цитата:
Сообщение от maninabox Посмотреть сообщение
скорее всего нет потоковой индексации, просто делает выборку из базы.
Забыл ответить на этот вопрос. Это полностью отдельная поисковая система, установленная на моем сервере. Минусы на лицо, сервер слабенький, не тянет. А прямо сейчас хостер вообще ушел в аут, недоступен ни он, не поисковой сервер Old-Web. Наверное завтра вернутся, починят и снова будем онлайн.

На самом деле отдельных поисковиков со своей базой, очень мало. А чтобы в индексе были только сайты определенной тематики/области, таких можно по пальцам пересчитать. Если бы я нашел поисковик, который был бы лучше чем на Old-Web по поиску в старых сайтах, я бы не стал делать свой. Но то что есть, это просто микро-поисковики, а у нас уже около 15 000 000 страниц старого веба в индексе.

Но я все равно недоволен, хочу в 10 раз большую базу страниц старых сайтов в поиске. Было бы больше денег, взял бы сервер в двое мощнее для поисковика, чтобы быстрее выдавался результат поиска.
__________________
Мой блог http://erikoblog.ru.
eriko на форуме   Ответить с цитированием
Старый 19.05.2025, 10:24   #8
Олд
 
Аватар для maninabox
 
Регистрация: 22.04.2025
Сообщений: 203
Вес репутации: 48
Репутация: - весьма и весьма положительная личность (200)
По умолчанию

Цитата:
Сообщение от danil Посмотреть сообщение
Забыл ответить на этот вопрос. Это полностью отдельная поисковая система, установленная на моем сервере.
Я и так в курсе
Движок сам по себе посредственный. Поискал по движкам, ничего лучше не нашел.
Цитата:
Сообщение от danil Посмотреть сообщение
Минусы на лицо, сервер слабенький, не тянет.
Не в сервере дело. Скрипт пишет в бд, оттуда забирает. А можно было сделать кеширование на винт и выдавать не результаты с базы, а уже готовые варианты. Как-то так все крупные поисковики работают.
maninabox на форуме   Ответить с цитированием
Старый 05.07.2025, 05:51   #9
Администратор
 
Аватар для eriko
 
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 1,442
Вес репутации: 100
По умолчанию

Последний месяц я медленно индексировал, чтобы поиском возможно было пользоваться, не нагружал сервак. Но все равно никто не пользуется, поэтому я врубил сейчас на полную мощность индексирование. Хоть базу увеличу.
__________________
Мой блог http://erikoblog.ru.
eriko на форуме   Ответить с цитированием
Старый 09.07.2025, 16:52   #10
Администратор
 
Аватар для eriko
 
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 1,442
Вес репутации: 100
По умолчанию

12 миллионов страниц уже в индексе. На этом индексирование новых сайтов временно приостанавливаю.

Продолжать, пока у меня для поиска такой медленный сервер, я не собираюсь.

Пользуйтесь, фоновых процессов нет, поэтому будет работать быстрее.

Советую использовать оператор filetype: и вводить расширение файла, например avi.

Я делал поиск, для того, чтобы можно было найти скрытые в старом интернете файлы, нарыть что-то редкое и эксклюзивное. 12 лямов файлов проиндексировано, поиск может искать даже внутри проиндексированных .zip.
__________________
Мой блог http://erikoblog.ru.
eriko на форуме   Ответить с цитированием
Ответ


Опции темы

Ваши права в разделе
Вы не можете создавать темы
Вы не можете отвечать на сообщения
Вы не можете прикреплять файлы
Вы не можете редактировать сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.
Быстрый переход

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Тема из 2035 года. Сегодня 1 июня Google отключает поисковик навсегда. eriko Флейм/Курилка 0 15.02.2025 13:24
Протестировал поисковик Brave и... я в ВОСТРОГЕ! eriko Обсуждение сайтов 2 25.10.2024 15:42


Часовой пояс GMT +3, время: 17:40.


Powered by vBulletin® Version 3.6.12
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd. Перевод: zCarot