![]() |
|
|||||||
|
|||||||
| Регистрация | Справка | Пользователи | Календарь | Сообщения за день | Поиск |
| Поисковые системы Обсуждаем, как искать правильно: альтернативы, трюки и баги поисковых систем. |
![]() |
|
|
Опции темы |
|
|
#1 |
|
Администратор
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 1,436
Вес репутации: 100
|
Раз уж у old-web есть свой поиск, то решил создать для него тему в соответствующем разделе.
У нас ищутся старые сайты, без слежки и JS. Как в начале нулевых. Поисковые операторы работают, например: 1) - 2) + 3) site: 4) кавычки В индекс пока что 10 лямов страниц. Место на сервере занято 5%, так что можем еще в 20 раз увеличить объем страниц, а это уже будет 200 000 000 страниц.
__________________
Мой блог http://erikoblog.ru. |
|
|
|
|
|
#2 |
|
Местный
Регистрация: 29.01.2025
Адрес: Ереван: Улица Акселя Бакунца, Москва: Улица Губкина, Кр
Сообщений: 86
Вес репутации: 0
Репутация: пока не определён (0)
|
20 миллионов! Мне кажется, на старых компах можно old web ставить домашней страницей, и спокойно забывать про остальной интернет
__________________
Назад, в будущее!
|
|
|
|
|
|
#3 |
|
Администратор
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 1,436
Вес репутации: 100
|
Пока что есть 10 миллионов страниц, буду идти к цифре 200 миллионов. Но надо понимать, что старый интернет не на столько велик. Мы неизбежно столкнёмся с нехваткой сайтов для индексации.
__________________
Мой блог http://erikoblog.ru. |
|
|
|
|
|
#5 |
|
Администратор
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 1,436
Вес репутации: 100
|
Движок Yacy. Да, туповат. Буду менять в будущем.
__________________
Мой блог http://erikoblog.ru. |
|
|
|
|
|
#6 |
|
Администратор
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 1,436
Вес репутации: 100
|
Закончил писать скрипт, который будет управлять очередью сайтов, которые нужно индексировать в поисковике Old-Web. Это значит, что не будет больше превышена нагрузка на сервер, из-за чего было невозможно искать, если индексировались сайты.
В том числе, теперь можно будет автоматизировать индексацию, а не вводить руками ссылки для индексации. Это даст возможность увеличить количество сайтов и страниц в поиске в разы. Добавлено через 2 минуты Если будет спрос на поиск, то в будущем увеличу для поискового сервера количество RAM и CPU, это увеличит скорость работы поисковика и сделает его более отзывчивым. Добавлено через 50 минут Добавил 75000 старых сайтов в очередь на индексацию.
__________________
Мой блог http://erikoblog.ru. Последний раз редактировалось eriko, 13.05.2025 в 14:44. Причина: Добавлено сообщение |
|
|
|
|
|
#7 | |
|
Администратор
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 1,436
Вес репутации: 100
|
Цитата:
На самом деле отдельных поисковиков со своей базой, очень мало. А чтобы в индексе были только сайты определенной тематики/области, таких можно по пальцам пересчитать. Если бы я нашел поисковик, который был бы лучше чем на Old-Web по поиску в старых сайтах, я бы не стал делать свой. Но то что есть, это просто микро-поисковики, а у нас уже около 15 000 000 страниц старого веба в индексе. Но я все равно недоволен, хочу в 10 раз большую базу страниц старых сайтов в поиске. Было бы больше денег, взял бы сервер в двое мощнее для поисковика, чтобы быстрее выдавался результат поиска.
__________________
Мой блог http://erikoblog.ru. |
|
|
|
|
|
|
#8 | |
|
Олд
Регистрация: 22.04.2025
Сообщений: 193
Вес репутации: 47
Репутация: - весьма и весьма положительная личность (200)
|
Цитата:
![]() Движок сам по себе посредственный. Поискал по движкам, ничего лучше не нашел. Не в сервере дело. Скрипт пишет в бд, оттуда забирает. А можно было сделать кеширование на винт и выдавать не результаты с базы, а уже готовые варианты. Как-то так все крупные поисковики работают. |
|
|
|
|
|
|
#9 |
|
Администратор
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 1,436
Вес репутации: 100
|
Последний месяц я медленно индексировал, чтобы поиском возможно было пользоваться, не нагружал сервак. Но все равно никто не пользуется, поэтому я врубил сейчас на полную мощность индексирование. Хоть базу увеличу.
__________________
Мой блог http://erikoblog.ru. |
|
|
|
|
|
#10 |
|
Администратор
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 1,436
Вес репутации: 100
|
12 миллионов страниц уже в индексе. На этом индексирование новых сайтов временно приостанавливаю.
Продолжать, пока у меня для поиска такой медленный сервер, я не собираюсь. Пользуйтесь, фоновых процессов нет, поэтому будет работать быстрее. Советую использовать оператор filetype: и вводить расширение файла, например avi. Я делал поиск, для того, чтобы можно было найти скрытые в старом интернете файлы, нарыть что-то редкое и эксклюзивное. 12 лямов файлов проиндексировано, поиск может искать даже внутри проиндексированных .zip.
__________________
Мой блог http://erikoblog.ru. |
|
|
|
![]() |
|
|
Похожие темы
|
||||
| Тема | Автор | Раздел | Ответов | Последнее сообщение |
| Тема из 2035 года. Сегодня 1 июня Google отключает поисковик навсегда. | eriko | Флейм/Курилка | 0 | 15.02.2025 13:24 |
| Протестировал поисковик Brave и... я в ВОСТРОГЕ! | eriko | Обсуждение сайтов | 2 | 25.10.2024 15:42 |
|