![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
|||||||||
![]() |
![]() |
![]() |
|||||||||||||||
![]() |
![]() |
||||||||||||||||
![]() |
![]() |
![]() |
|||||||||||||||
![]() |
![]() |
||||||||||||||||
![]() |
![]() |
||||||||||||||||
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
||||||||
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
|
|
Регистрация | Справка | Пользователи | Календарь | Поиск | Сообщения за день | Все разделы прочитаны |
![]() |
|
Опции темы | Опции просмотра |
|
![]() |
#1 |
Администратор
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 1,122
|
![]() Раз уж у old-web есть свой поиск, то решил создать для него тему в соответствующем разделе.
У нас ищутся старые сайты, без слежки и JS. Как в начале нулевых. Поисковые операторы работают, например: 1) - 2) + 3) site: 4) кавычки В индекс пока что 10 лямов страниц. Место на сервере занято 5%, так что можем еще в 20 раз увеличить объем страниц, а это уже будет 200 000 000 страниц.
__________________
Что делать, если вы со мной не согласны? Помнить, что написанное не истина в последней инстанции, а всего лишь мое мнение, которое я не навязываю вам. |
![]() |
![]() |
![]() |
#2 |
Пользователь
|
![]() 20 миллионов! Мне кажется, на старых компах можно old web ставить домашней страницей, и спокойно забывать про остальной интернет
__________________
Назад, в будущее! ![]() |
![]() |
![]() |
![]() |
#3 |
Администратор
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 1,122
|
![]() Пока что есть 10 миллионов страниц, буду идти к цифре 200 миллионов. Но надо понимать, что старый интернет не на столько велик. Мы неизбежно столкнёмся с нехваткой сайтов для индексации.
__________________
Что делать, если вы со мной не согласны? Помнить, что написанное не истина в последней инстанции, а всего лишь мое мнение, которое я не навязываю вам. |
![]() |
![]() |
![]() |
#4 |
Местный
|
![]() А что за движок используется?
Смотрю по отзывчивости, он немного туповат, скорее всего нет потоковой индексации, просто делает выборку из базы. |
![]() |
![]() |
![]() |
#5 |
Администратор
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 1,122
|
![]() Движок Yacy. Да, туповат. Буду менять в будущем.
__________________
Что делать, если вы со мной не согласны? Помнить, что написанное не истина в последней инстанции, а всего лишь мое мнение, которое я не навязываю вам. |
![]() |
![]() |
![]() |
#6 | |
Администратор
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 1,122
|
![]() Цитата:
На самом деле отдельных поисковиков со своей базой, очень мало. А чтобы в индексе были только сайты определенной тематики/области, таких можно по пальцам пересчитать. Если бы я нашел поисковик, который был бы лучше чем на Old-Web по поиску в старых сайтах, я бы не стал делать свой. Но то что есть, это просто микро-поисковики, а у нас уже около 15 000 000 страниц старого веба в индексе. Но я все равно недоволен, хочу в 10 раз большую базу страниц старых сайтов в поиске. Было бы больше денег, взял бы сервер в двое мощнее для поисковика, чтобы быстрее выдавался результат поиска.
__________________
Что делать, если вы со мной не согласны? Помнить, что написанное не истина в последней инстанции, а всего лишь мое мнение, которое я не навязываю вам. |
|
![]() |
![]() |
![]() |
#7 | |
Местный
|
![]() Цитата:
![]() Движок сам по себе посредственный. Поискал по движкам, ничего лучше не нашел. Не в сервере дело. Скрипт пишет в бд, оттуда забирает. А можно было сделать кеширование на винт и выдавать не результаты с базы, а уже готовые варианты. Как-то так все крупные поисковики работают. |
|
![]() |
![]() |
![]() |
#8 |
Администратор
Регистрация: 29.06.2024
Адрес: Живу в своем мирке, который строю для себя.
Сообщений: 1,122
|
![]() Закончил писать скрипт, который будет управлять очередью сайтов, которые нужно индексировать в поисковике Old-Web. Это значит, что не будет больше превышена нагрузка на сервер, из-за чего было невозможно искать, если индексировались сайты.
В том числе, теперь можно будет автоматизировать индексацию, а не вводить руками ссылки для индексации. Это даст возможность увеличить количество сайтов и страниц в поиске в разы. Добавлено через 2 минуты Если будет спрос на поиск, то в будущем увеличу для поискового сервера количество RAM и CPU, это увеличит скорость работы поисковика и сделает его более отзывчивым. Добавлено через 50 минут Добавил 75000 старых сайтов в очередь на индексацию.
__________________
Что делать, если вы со мной не согласны? Помнить, что написанное не истина в последней инстанции, а всего лишь мое мнение, которое я не навязываю вам. Последний раз редактировалось danil, 13.05.2025 в 11:44. Причина: Добавлено сообщение |
![]() |
![]() |
![]() |
Опции темы | |
Опции просмотра | |
|
|
![]() |
||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Тема из 2035 года. Сегодня 1 июня Google отключает поисковик навсегда. | danil | Флейм/Курилка | 0 | 15.02.2025 10:24 |
Протестировал поисковик Brave и... я в ВОСТРОГЕ! | danil | Сайты | 2 | 25.10.2024 12:42 |
|