После некоторых колебаний я выложил программу — анализатора перелинковки сайта в сеть (обычно такие программы идут как shareware). Буду рад вопросам и комментариям к ней.
Назначение программы
Инструмент предназначен для проверки ссылочных весов страниц сайта или нескольких связанных между собой сайтов.
Ссылочный вес используется поисковыми системами при ранжировании страниц сайтов в поисковой выдаче.
В программе сылочный вес называется как PageRank, так как алгоритм его расчета был запатентован Google, но в целом результаты проверки могут быть отенесены и к другим поисковым системам, в частности к Яндексу.
Принцип действия
При расчете PageRank для страниц выбранных сайтов, автором было сделано предположение о том, что влияние выбранных сайтов на весь веб принебрежимо мало и поэтому изменения внутри сайтов, не влияют на вес входных внешних ссылок. Данное предположение, дало возможность заменить входные ссылки входным PageRank и определить PageRank для страниц сайта локально, не пересчитывая весь веб.
Техническая реализация
Программа написана в виде макросов рабочей книги excel. Для сканирования веба анализатор запускает браузер IExplorer в автоматическом режиме.
Инструкция по применению
Для запуска программы нужно открыть книгу (файл анализатора) с помощью excel и разрешить выполнение макросов в ней. После этого нужно последовательно выполнять инструкции для каждого шага работы (step1, step2…)
Возможные неполадки и их разрешение
- Программа зависает при сканировании веба, сканирование неожиданно останавливается.
- Так как программа сканирует веб с помощью браузера, то активное содержание страниц сайта может вызвать сбои в ее работе. Для разрешения проблем рекомендуется отключить выполнение активного содержания в браузере IExplorer (на время выполнения программы). Для этого надо открыть IExplorer, зайти на вкладку безопасности в свойствах обозревателя и поотключать все, что только возможно.
- Скорость сканирования мала, картинки на страницах сайта долго грузятся.
- Отключить показ картинок в браузере IExplorer. Зайти в свойствах обозревателя на вкладку «дополнительно» и убрать галочку с пункта «Показывать изображения».
1) Программа выдает отклик Ошибка отклика- «bad» (даже для главной) при проверке вручную страницы открываются….
2) Почему- то вместе с «Проверкой списка страниц» запускается «Рассчитать матрицу связей»… а ведь не все страницы еще спарсила…
3) «Рассчитать матрицу связей»- работает, работает, и — Run-time error 1004
4) «Проверить» (входящие ссылки)- и откуда их парсить (с Page Rank-ом — то? :) )
4) «Очистить список» работает, по-видимому. некорректно- для проверки следующего сайта программу приходится перезапускать, иначе- ERROR 99.
П.С. сайт, на всякий случай вбил в сообщение неправильный.
П.П.С. а если прога будет работать, то ИМХО- полезная штука. еще бы и внутренние ошибки перелинковки выдавала…
Спасибо Александр. Если бы Вы мне прислали заполненный файл, я бы проверил. Вообще говоря программа работает, так что наверное, вы что-то не то делали (помощь, конечно, оставляет желать лучшего). Некоторые возможные неисправности могут возникать из-за того, что программа использует браузер для сканирования веба. Как с этим бороться я теперь написал в разделе неисправности. Откуда парсить входящие ссылки — например, из панели веб мастера yandex взять. После вашего замечания я ввел проверку внутренних ссылок, чтобы исключить ситуацию, когда разные внутренние ссылки показывают на один URL.
снимать защиту нужно?
Нет, никакой новой функциональости от снятия защиты не будет.
я не понял мне нельзя пользоваться чтоли прогой, или как? и сразу вопрос если можно пользоваться, то непонятно куда урл то вводить, просит снять с защиты
Роман, делаем по-порядку. Идем сначала на лист step1. Затем в строчке A7 набираем домен — design-sites.ru, например. Ничего здесь больше не делаем и идем на лист step2 — нажимаем на кнопку Check the page list и.т.д.
Какой, кстати, версией excel вы пользуетесь Роман?
Здравствуйте! Неполадка «сканирование неожиданно останавливается», что значит во вкладке безопасность «поотключать все что только можно? Вроде там и отключать-то нечего… Устранить неполадку не получается :(
Я обычно поступаю следующим образом. Сначала настраиваю IE — уровень безопасности наивысший, картинки отключены. Затем иду на лист setting — и устанавливаю требуемые расширения (php,html, aspx …) у ссылок и убираю галку на «выдавать сообщения о редиректах» — эта опция скорее для отладки, чем для реальной работы. Если сканирование все-таки остановилось, то возможно там какой-то сложный html, может фреймы или еще что-то. Если вы скажете url сканируемого сайта, я скажу точно в чем неприятность.
шикарная программа, спасибо автору за это.
А если меня интересует только внутренняя перелинковка, я могу пропустить шаг 3? Я пытаюсь посчитать таким образом, но ничего не получается Выдает все страницам одинаковый PageRank — 0,15, несмотря на то, что у меня некоторіе подразделі имеют большое количество ссылок по сравнению с другими.
Шаг 3 я тоже обычно пропускаю и смотрю только внутренние веса, веса обычно разные, кроме того все по 0.15 это странно, большой отток на внешние ссылки.
На этапе 2 открывает два окна IE. Одно пустое, во второе грузит главную страницу сайта и потом закрывает все. Настройки безопасности высокие.
Спасибо за комментарий. Два или одно окно браузера будет открыто зависит от настройки «проверять редирект во внутренних ссылках». Второе окно это как раз проверка редиректов. Проверьте на другом сайте, уменьшите безопасность. и.т.д., обычно проблема решается.
Ошибка отклика
bad-2146697211
и показывает номер системной ошибки при этом. Не знаю контекста, но проверить что данная ссылка не битая.
Добрый!
Программа не дает возможности ввести адрес сайта в поле 7 step 2
Что-то не туда вводите. На листе step2 вы обычно ничего не вводите, просто нажимаете кнопку check the page list, а когда программа просканирует сайт, нажимаете Calculate the link matrix. Адрес сайт берется из step1.