18+

Артур Скальский

©  Газета.Ru

Интернет и ИТ Мир

2820

22.10.2010, 00:32

Кликай по-научному

Популярность веб-сайтов описана математической моделью.

Создана математическая модель, описывающая динамику популярности веб-сайтов. Оказалось, что посещаемость сайта изменяется не плавно, а резкими случайными всплесками, которые и позволяют «делать кассу» рекламе. Провоцировать эти всплески сложно, однако социальные сети — самый лучший инструмент для этого.

Как веб-сайты становятся популярными? Почему одни страницы становятся популярными очень быстро, другие наращивают число посетителей постепенно, а третьи вообще остаются малоизвестными? Есть ли математическая закономерность в этих процессах?

Этими вопросами задались ученые из США (Университет Индианы) и Италии (Турин). Они проанализировали два огромных массива данных — статьи «Википедии» и интернет-пространство целой страны — Чили.

Их исследование показало, что нарастание онлайн-популярности наступает не в результате постепенного накопления числа посетителей страницы, а происходит резкими вспышками.

Такое поведение свойственно так называемым критическим системам — к ним относятся крахи фондовых рынков и ряд природных явлений. Работу математиков публикует Physical Review Letters. Они также разработали модель, которая описывает динамику онлайн-популярности.

«Популярность в интернете — непредсказуемая вещь, внимание публики резко перемещается от одного ресурса к другому. Статистически эти колебания подобны землетрясения и лавинам», — пояснил первый автор работы Джейкоб Раткевич из Университета Индианы.

Онлайн-информация, резко становящаяся популярной, оказывает огромное влияние на формирование позиции общества, культуру и политику.

Кроме того, реклама, размещенная на сайте, «ставшем звездой», становится неизмеримо прибыльней всякой иной. Конечно, каждый сайт стремится стать как можно более посещаемым и сохранить во времени своих читателей, однако практика показывает, что «гиперпосещаемость» почти никогда не удается удержать.

В первом изученном примере — посещаемости «Википедии» — ученые проанализировали два параметра: число кликов, ведущих на каждую статью, а также число ссылок на нее, опубликованных на внешних ресурсах. В более ранних работах утверждалось, что распределение популярности веб-страниц подчиняется степенной зависимости. Однако судить о динамике популярности каждой отдельной страницы было сложно, так как информации о числе посетителей и ссылок в каждый момент времени не было. Авторы работы восполнили этот пробел: они обработали информацию о трафике от миллионов страниц. Всего были обработаны три миллиона статей «Википедии» (2001—2007 годов) с временным разрешением в одну секунду, три миллиона статей «Википедии» (2008—2010 годов) с временным разрешением в один час и три миллиона интернет-страниц домена Чили (.cl) с разрешением один год (2002—2006 годов). Разрешение показывает частоту «сетки», наименьший период времени, через который производится вторичное детектирование посещаемости страницы. Для этого использовались внутренние данные «Википедии», а также информация чилийского поисковика TODOCL.

Оказалось, что почти все страницы переживали вспышку популярности в самом начале своего существования. Затем некоторые страницы действительно показывали стабильный экспоненциальный рост, однако большая часть в среднем сохраняла небольшую посещаемость, ее рост и падение происходили резкими скачками.

Распределение скачков посещаемости сайтов, как оказалось, подчиняется «закону тяжелого хвоста», также характерного для критических систем.

Такое распределение чрезвычайно неравномерно: большая часть точек характеризуется небольшими значениями (в данном случае это число посетителей в день), и лишь малая часть — очень большими. Однако именно эти всплески определяют суммарный трафик: они столь велики, что каждый из них на порядки превышает суммарную величину посещаемости «неудачных дней». Однако динамика этих «всплесков» отличается от динамики популярности «горячей» новости, подчеркивают ученые. Если внимание, обращаемое на новость, очень быстро затухает, то «всплески» популярности сайтов следуют сериями, и это в итоге влияет на повышение общей популярности страницы.

Математики разработали классификационную модель, которая качественно воспроизводит часть особенностей «всплескового» поведения популярности веб-сайтов, однако для более качественного описания «эффекта тяжелого хвоста» им пришлось добавить в модель специальный «реклассификационный механизм». Реклассификация случайным образом «вздувает» популярной той или иной страницы. Парадоксально, но именно такой механизм позволяет приблизить модель к описанию экспериментальных данных.

«Несмотря на то что модель имеет в больше степени описательный характер, мы надеемся, что более глубокое понимание процесса развития популярности веб-сайта приведет в конечном итоге к развитию методов прогнозирования возникновения популярности именно в упреждающем смысле.

Однако искусственно повысить популярность какого-то конкретного сайта с помощью нашего механизма не удастся», — подытожил Раткевич.

Однако ученые уже готовы предоставить рецепт популярности. Анализ использования социальных сетей в формировании популярности сайтов показал, что они вполне пригодны как минимум для создания временного всплеска посещаемости. «Бомбы из твиттера» взлетают в рейтингах, как ракеты, и могут легко забраться на самую верхушку результатов поиска Google», — отмечают исследователи.

Артур Скальский

©  Газета.Ru

Интернет и ИТ Мир

2820

22.10.2010, 00:32

URL: https://m.babr24.net/?ADE=89173

Bytes: 5391 / 5391

Скачать PDF

Поделиться в соцсетях:

Также читайте эксклюзивную информацию в соцсетях:
- Телеграм
- ВКонтакте

Связаться с редакцией Бабра:
[email protected]

Другие статьи и новости в рубрике "Интернет и ИТ"

В Монголии появится Центр по борьбе с ложной информацией

В Монголии создадут Центр по борьбе с ложной информацией.

Источник: Babr24.com.

Интернет и ИТ

Монголия

988

11.02.2025

Монголия ускоряет цифровизацию: перспективы внедрения 5G

Монголия уверенно движется в направлении цифровой трансформации, стремясь повсеместно внедрить технологию 5G и повысить скорость интернета в десять ...

Автор: Эрнест Баатырев.

Источник: Babr24.com.

Интернет и ИТ, Общество

Монголия

1128

11.02.2025

Глава или не глава: отдалённая Хатанга и эпоха цифровизации

Интересная и неоднозначная ситуация произошла с красноярской редакцией Бабра. Полагаем, эта история могла бы и не стать достоянием общественности.

Автор: Анна Роменская.

Источник: Babr24.com.

Интернет и ИТ, Политика

Красноярск

6311

06.02.2025

В 2024 году бот Т2 отвлекал мошенников 18 миллионов минут

В 2024 году 75 миллионов скам-звонков в сети Т2 оказались заблокированы.

Автор: Саша Савельева.

Источник: Babr24.com.

Интернет и ИТ

Россия

8634

31.01.2025

Сеть 4G провели в 13 сел Бурятии

Еще 13 населенных пунктов Бурятии обеспечили сотовой связью и высокоскоростным интернетом 4G. Их пользователями стали четыре тысячи человек.

В Новосибирске на два дня прервутся радио- и телесигналы

В Новосибирске ожидаются технические работы на теле- и радиотрансляции 27 января и 2 февраля.

Источник: Babr24.com.

Интернет и ИТ

Новосибирск

2228

25.01.2025

T2 обновила резервное оборудование на каждой 5-й базовой станции в Иркутской области в 2024 году

Резервные источники питания, которые поддерживают работу базовых станций даже при отключении электроэнергии, есть на всех сотовых вышках оператора.

Автор: Саша Савельева.

Источник: Babr24.com.

Интернет и ИТ

Иркутск

2430

23.01.2025

В Новосибирской области ожидаются перебои в телевещании

В Новосибирской области ожидаются перебои в радио- и телевещании с 20 по 26 января.

Источник: Babr24.com.

Интернет и ИТ

Новосибирск

2136

21.01.2025

В Новосибирске на восемь часов прервется телевещание

15 января в Новосибирске на восемь часов прервется телевещание трех каналов. Об этом сообщили в Российской телевизионной и радиовещательной сети.

Источник: Babr24.com.

Интернет и ИТ

Новосибирск

2585

12.01.2025

Ски-пасс и кофе в Листвянке и Братске дешевле для абонентов Т2

Т2 договорился с горнолыжными курортами о бонусах для своих абонентов.

Источник: Babr24.com.

Интернет и ИТ, Туризм

Иркутск

3688

27.12.2024

Т2 запустила в Иркутской области звонки через интернет

Звонки через сеть 4G, с отличным качеством звука, которые тарифицируются как обычные? Легко, с новой услугой Voice over LTE, или VoLTE от Т2.

Автор: Саша Савельева.

Источник: Babr24.com.

Интернет и ИТ

Иркутск

4476

17.12.2024

В новосибирских детсадах запрещают групповые чаты в Telegram и WhatsApp

В нескольких новосибирских детских садах родителям запрещают использовать групповые чаты в мессенджерах Telegram и WhatsApp.