Ответить Создать тему

Как узнать где создаётся ссылка на сайт?

alexey
post Mar 13 2024, 12:18 
Отправлено #1


-

Сообщений: 68 168
Из: Чебоксары
Telegram: @blog21



В Яндекс.Вебмастере постоянно добавляются на индексацию адреса вида https://cheb.ru/news/%3Fshownews%3D194724?shownews=94938

Адресов похожих прямо много - тысячи штук. Страницы по этим адресам уже давно выдают 404-ю ошибку и не должны индексироваться. Но Яндекс.Вебмастер их тщательно забирает в индекс сайта и дальше они висят там как ошибки. Я пробовал все эти страницы вычищать, но они создаются снова и снова. И буквально тысячами.

Подозреваю, что где-то у нас на сайте ошибка. Как-то неправильно прописана ссылка, которая генерирует такие вот https://cheb.ru/news/%3Fshownews%3D194724?shownews=94938. И надо просканировать сайт, эту ошибку найти и исправить. Ищем, пока не можем найти.

Но можно же как-то узнать информацию: откуда определенный адрес у Яндекса? Где именно он его взял. Вроде это нормальная потребность любого вебмастера узнать источник ссылки, которая появилась.

Про раздел "Сссылки" в Яндекс.Вебмастере знаю. Там очень старая и неактуальная информация

--------------------
Да нормальный был год.
Это вы ещё просто 2024-й не видели!
Profile CardPM
  0/0  
senn
post Mar 16 2024, 00:46 
Отправлено #2


Постоялец

Сообщений: 362



ссылка https://cheb.ru/news/%3Fshownews%3D194724?shownews=94938
если на нее перейти выдает - Чебоксары > Справочник > Error 404
походу битая ссылка вы либо удалили, либо отредактировали данные
там еще указано news - возможно удаленная или редактированная новость

p/s
рабочая ссылка https://cheb.ru/doma/prezid/17.xhtml
https://cheb.ru/news/?shownews=292313

может ты коллекционируешь битые ссылкки???
например поменял данные в магазине - Магазин и новые данные сохраняешь по новой ссылке

твой вопрос надо на других ресурсах задавать

p/s/s привиди пример битой ссылки яндакса - например магазина или новости, если привести примера не сможешь значит бет биты у тебя в голове

или сформулируй проблему по-другому, похоуд тебя никто не понял
Profile CardPM
  -2/0  
senn
post Mar 16 2024, 01:15 
Отправлено #3


Постоялец

Сообщений: 362



для примера - как я понимаю твое сообщение
юзер в яндексе задает какой-нибудь поиск по чувашии
и яндекс выдает ему битую ссылку https://cheb.ru,,,,,,,,,,,,,,,,,,,
ты ж не это хотел спросить?
Profile CardPM
  -1/0  
Альгиз
post Mar 16 2024, 01:23 
Отправлено #4


Активный

Сообщений: 17 673



Цитата(senn @ Mar 16 2024, 00:46)
или сформулируй проблему по-другому, похоуд тебя никто не понял
*

Не поняли.
Проблема понятна. Для чего хотят узнать, где создаётся ссылка на сайт, не понятно. Их же роботы собирают для поисковиков. Созданы они на самом сайте. Собрали их роботы. Поисковик выдаёт собранное. Нет битой страницы на самом сайте, нет проблем. Для поиска битых страниц на самом сайте, наверное, можно своего робота/программу создать. Может готовые есть.

Робот обходит все страницы сайта. Если их с сайта не убрать, он их опять в выдачу добавит. Это машина, она по другому не умеет.

Возможно, я не поняла вопроса.
Profile CardPM
  -3/0  
alexey
post Mar 16 2024, 07:14 
Отправлено #5


-

Сообщений: 68 168
Из: Чебоксары
Telegram: @blog21



Цитата(senn @ Mar 16 2024, 01:15)
для примера - как я понимаю твое сообщение
юзер в яндексе задает какой-нибудь поиск по чувашии
и яндекс выдает ему битую ссылку https://cheb.ru,,,,,,,,,,,,,,,,,,,
ты ж не это хотел спросить?
*

До пользователей в поиске такие ссылки не доходят.
Просто Яндекс откуда-то скачивает мусорные страницы, потом жалуется на то, что на сайте много муосра, не сообщая о том откуда он ссылки на этот мусор взял. Страницы при этом запрещены к индексированию.

--------------------
Да нормальный был год.
Это вы ещё просто 2024-й не видели!
Profile CardPM
  0/0  
Альгиз
post Mar 16 2024, 08:43 
Отправлено #6


Активный

Сообщений: 17 673



Цитата(alexey @ Mar 16 2024, 07:14)
Страницы при этом запрещены к индексированию.
*

Когда поисковики это останавливало? Сколько поисковиков, столько и мнений на этот счёт.
Profile CardPM
  -3/0  
alexey
post Mar 16 2024, 08:54 
Отправлено #7


-

Сообщений: 68 168
Из: Чебоксары
Telegram: @blog21



Цитата(senn @ Mar 16 2024, 00:46)
твой вопрос надо на других ресурсах задавать
*

Либо можно не отвечать тем кто не разбирается в вопросе.

--------------------
Да нормальный был год.
Это вы ещё просто 2024-й не видели!
Profile CardPM
  -1/+4  
DDP
post Mar 16 2024, 23:21 
Отправлено #8


D

Сообщений: 7 987
Из: Cheboksary



А поддержка Яндекса чего говорит?
Profile CardPM
  0/0  
alexey
post Mar 17 2024, 08:12 
Отправлено #9


-

Сообщений: 68 168
Из: Чебоксары
Telegram: @blog21



Цитата(DDP @ Mar 16 2024, 23:21)
А поддержка Яндекса чего говорит?
*

Достучатся до поддержки Яндекс.вебмастера очень сложно.
Если же гуглить ответ в их справочнике, там советуют раздел "Ссылки", информация в котором не обрабатывается месяцами.

--------------------
Да нормальный был год.
Это вы ещё просто 2024-й не видели!
Profile CardPM
  0/0  
MPA3b
post Mar 18 2024, 02:07 
Отправлено #10


мимимишки-мимими.

Сообщений: 2 956
Из: Чебоксары



Цитата(alexey @ Mar 13 2024, 12:18)
Подозреваю, что где-то у нас на сайте ошибка. Как-то неправильно прописана ссылка, которая генерирует такие вот https://cheb.ru/news/%3Fshownews%3D194724?shownews=94938. И надо просканировать сайт, эту ошибку найти и исправить. Ищем, пока не можем найти.
/right]

Можно добавить в конфиг сервера регулярку на перезапись запроса для исправления последствий.

Итоговая неверная ссылка это результат url_encode(). Проверить можно тут.

Т.е. где-то формируются ссылки, при чём строка ссылки кодируется через url_encode() (PHP).

Ищите, где у вас в коде формируются ссылки как строки и используется url_encode().

Теоретически, часть проблемы индексации и склеивания дублирующихся страниц должно решить добавление мета-тега <link rel="canonical">.

Возможно, где-то используется url_encode() вместо http_build_query().

Вообще, если есть git и дата первого появления неверных ссылок -- просто нужно смотреть коммиты в релизах.

Сообщение отредактировал MPA3b - Mar 18 2024, 15:03

--------------------
Делаю сайты.
Profile CardPM
  0/0  
alexey
post Mar 18 2024, 02:40 
Отправлено #11


-

Сообщений: 68 168
Из: Чебоксары
Telegram: @blog21



MPA3b, Спасибо за подробный ответ! Будем его изучать.

Пока источник битых ссылок получилось посмотреть в Google Search Console. Здесь:

Страницы > Индексирование страниц > Не найдено (404)

Информация там очень не оперативная. Но, думаю, она может поспособствовать поиску и исправлению ошибок.

--------------------
Да нормальный был год.
Это вы ещё просто 2024-й не видели!
Profile CardPM
  0/0  
MPA3b
post Mar 18 2024, 15:01 
Отправлено #12


мимимишки-мимими.

Сообщений: 2 956
Из: Чебоксары



Цитата(alexey @ Mar 18 2024, 02:40)
MPA3b, Спасибо за подробный ответ! Будем его изучать.

Пока источник битых ссылок получилось посмотреть в Google Search Console. Здесь:

Страницы > Индексирование страниц > Не найдено (404)

Информация там очень не оперативная. Но, думаю, она может поспособствовать поиску и исправлению ошибок.
*


regex для grep не скажу, не особо умею в них.
а так -- в любой IDE открываем проект, исключаем ядро и модули, ищем вхождение строки url_endcode(, а там смотрим, где есть <a>.

Сообщение отредактировал MPA3b - Mar 18 2024, 15:03

--------------------
Делаю сайты.
Profile CardPM
  0/0  

ОтветитьTopic Options
1 чел. читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
Быстрый ответ
Кнопки кодов
 Расширенный режим
 Нормальный режим
    Закрыть все тэги


Открытых тэгов: 
Введите сообщение
Смайлики
smilie  smilie  smilie  smilie  smilie 
smilie  smilie  smilie  smilie  smilie 
smilie  smilie  smilie  smilie  smilie 
smilie  smilie  smilie  smilie  smilie 
smilie  smilie  smilie  smilie  smilie 
smilie  smilie  smilie  smilie  smilie 
         
Показать все

Опции сообщения