mstdn.social is one of the many independent Mastodon servers you can use to participate in the fediverse.
A general-purpose Mastodon server with a 500 character limit. All languages are welcome.

Administered by:

Server stats:

16K
active users

#search_engine

0 posts0 participants0 posts today

Positional Bias: Что это такое и как с ним жить? Учимся правильно предсказывать CTR

Поговорим про такого зверя, как positional bias . Разберёмся на примере задачи по ml system design — предсказание вероятности клика по товару в поисковой выдаче. Рассмотрим основные подходы к решению: дисконтирование таргета, добавление «позиции» как фичи и другие подходы, используемые в рекомендательных системах и поисковых алгоритмах.

habr.com/ru/articles/887426/

ХабрPositional Bias: Что это такое и как с ним жить? Учимся правильно предсказывать CTRПривет! Сегодня поговорим про такого зверя, как  positional bias . Если вы работаете с поисковыми системами или рекомендательными сервисами, то наверняка сталкивались с этой проблемой. Разберёмся...

When You Search for ‘Google’ on Bing, Bing Attempts to Trick You Into Thinking the Results Page Is Google
daringfireball.net/linked/2025

"It’s a clear attempt from Microsoft to make Bing look like Google for this specific search query, and other searches just list the usual Bing search results without this special interface."

Daring FireballWhen You Search for ‘Google’ on Bing, Bing Attempts to Trick You Into Thinking the Results Page Is GoogleLink to: https://www.theverge.com/2025/1/6/24337117/microsoft-bing-search-results-google-design-trick

Since a typical sees all the traffic going through it (and there be lots of it), I started wondering if someone running one of such bridges indexes the data for search purposes… How would such data collection be perceived by the community? :thinkmint:
On one hand it's all public stream of data, on the other I'd probably feel quite uncomfortable. Having seemingly no crawlers here feels pretty cozy

Depuis 15 jours je bosse sur un moteur de recherche alternatif français/anglais.

L'algo progresse bien, à partir d'une base de donné vierge, en scrawlant 2 minutes, j'ai ça comme résultat sur le mot clé 'agriculture'.

Il semble que ça soit très chiant d'héberger un moteur de recherche alternatif : est-ce que je ne risque pas de de me prendre sans arrêt des demandes de censure de la part des autorités pour telle ou telles sites ?

Si je veux rester tranquille : dois-je rester uniquement sur la base d'une application indépendante pour chaque utilisateur ?

[Перевод] Создание приложения для обратного поиска изображений с помощью Manticore Search

TL;DR: Узнайте, как создать приложение для обратного поиска изображений с использованием Manticore Search. В статье рассказывается об истории технологии, её устройстве и практических подходах к системам поиска изображений. Введение Обратный поиск изображений изменил способ поиска цифрового контента, позволяя искать с помощью изображений, а не текста. Эта технология широко используется: от помощи покупателям в поиске товаров до проверки дизайнов у дизайнеров. Она стала важным инструментом во многих цифровых платформах. Попробуйте демо на image.manticoresearch.com или посмотрите реализацию на GitHub. Мы разберём, как работает обратный поиск изображений, его реальные применения и как векторный поиск делает этот инструмент удобным и эффективным для самых разных задач — от повседневного серфинга до узкоспециализированных приложений.

habr.com/ru/articles/859418/

ХабрСоздание приложения для обратного поиска изображений с помощью Manticore SearchВведение Обратный поиск изображений изменил наш способ поиска цифрового контента. Теперь пользователи могут искать с помощью изображений, а не текста. Эта технология имеет множество применений: от...

Bon, avec la censure qui s’accélère, et Google et Bing qui font toujours plus de la merde, j'entends leurs white list qui réduit [...]. Certains disent que le web est en train de diminuer, les blogs plus référencés ...

Faut une solution ! Chouette ça existe déjà, un moteur de recherche self hosté qui permet de web scrawler les sites de notre choix ?:

yacy.net

Ok faut que j'étudie ça !!

(PS : il y a une page de démo fonctionnel pour tester directement)

yacy.netHome - YaCyYaCy P2P - Decentralized Search Engine

I've switched to use Kagi as my default search engine. This mean I pay for my searches for the first time in my life

Some 12 dollar each month to have unlimited searches and additional features Kagi offers.

So, why am I paying for searching? Other search engines sell my data. Either privacy invasive or less privacy invasive.

Kagi has another approach which is you pay for the service with actual money and they don't sell your data. I like that.

Внедрение поисковой системы в крупное CRM-решение: наш опыт

Один из наших длительных проектов - это крупное многопользовательское SaaS-решение (CRM-система) основанное на микросервисной архитектуре и развернутое в облаке Azure. Изначально это был MVP, где все части (сервисы, базы данных и т. д.) располагались на одной виртуальной машине. Со временем проект вырос в облачное распределенное решение с множеством веб- и мобильных клиентов. В этой статье мы расскажем, как решили одну из проблем, с которой столкнулись в процессе разработки.

habr.com/ru/articles/828104/

ХабрВнедрение поисковой системы в крупное CRM-решение: наш опытОдин из наших длительных проектов - это крупное многопользовательское SaaS-решение (CRM-система) основанное на микросервисной архитектуре и развернутое в облаке Azure. Изначально это был MVP, где все...

[Перевод] Поиск в будущем

Привычный поиск, вроде Google, работает сугубо в прошлом. То есть любые результаты, которые вы можете увидеть - это то, что уже произошло. Кроме того, есть ещё дополнительные временные издержки на индексирование: дни или даже недели . Неплохо для исторических справок, но всегда слишком поздно для важных новостей. Есть и другой путь - "перспективный" поиск . Суть его в том, чтобы получить результат в будущем. Лучше всего подходит для наблюдения за СМИ, поиска работы и других типов выгодных предложений.

habr.com/ru/articles/804289/

ХабрПоиск в будущем1. Что Привычный поиск, вроде Google, работает сугубо в прошлом. То есть любые результаты, которые вы можете увидеть - это то, что уже когда-то произошло. Кроме того, есть ещё дополнительные временные...