41 заметка с тегом

статистика

Позднее Ctrl + ↑

#нозачем

Каждый раз, когда я рассказываю про OpenStreetMap, собеседник спрашивает: «а почему бы просто не открыть карту Google?» С практической точки зрения это логичный вопрос, но здесь важна не только практичность, но и то общество, которое мы приближаем своим выбором.

Serge Wroclawski в начале месяца сочинил заметку «Зачем миру нужен OpenStreetMap»: по сути, список причин, почему гугль плохой, а OSM хороший. Самые азы, любой участник нашего проекта расскажет не хуже, хотя с написанием текстов у русских швах. Обычно такие заметки, нередко пробегающие в блогах участников и в официальном блоге, остаются незамеченными. Но не в этот раз: Serge обнаружил боле 120 тысяч уникальных посещений статьи, ошеломительные числа ретвитов, шеров, лайков, голосов и упоминаний, публикацию на Gizmodo и, позавчера утром, свою статью на сайте популярной английской газеты The Guardian со смешными иллюстрациями.

Популярность заметки показала не только заинтересованность людей в OSM, но и то, что проект до сих пор неизвестен. Будучи активным участником уже четвёртый год, я считаю моветоном рассказывать об основах OpenStreetMap на широкую публику: мол, это как википедия, но про карты (в чатике #osm обсуждали наивный, но резонный вопрос из комментариев к статьям: а как же викимапия тогда?). Сколько можно? Проект растёт каждый год, Саймон Пул, наш новый лидер, в новогоднем поздравлении поделился ощущением, что использование OSM гигантами вроде Bosch, Garmin, Mercedes уже не воспринимается как потрясение, а просто встаёт в ряд хороших новостей. «Мы должны постоянно напоминать себе, что мы, участники маленького открытого проекта, удивительным образом проникаем в ниши, доселе открытые лишь для государственных предприятий и гигантских корпораций».

И тут — «вы не властны над составом карты Google, и компания скопила подозрительно много информации, того и гляди сотрут вас с карты: пользуйтесь OpenStreetMap, картой, которую может править каждый!» Удивительно простодушная заметка, которую я собрался было перевести для хабра, чтобы провести эксперимент с измерением её популярности в России, но не смог из-за зияющих логических дыр, которые обнажились бы при переводе (или из-за недостаточного знания языка). Но заметка-то популярна! Какая разница, кто чуть не монополизировал время в XIX веке, если текст трогает сотни тысяч читателей, процент которых комментирует не формулировки, а суть заметки, всё теми же знакомыми каждому фразами «ничего не знаю, мой дом есть на Google Maps» и «мне очень понравился OSM в моей прошлой велопоездке». Активисты OpenStreetMap окучивают комментаторов, убеждая их поправить карту, и количество регистраций из Великобритании и США едва ли не впервые превысило этот показатель для Германии. Статьи про способы использования карты и анализ геоданных не работают, потому что адресованы редким читателям. Срыв покровов и долбёжка очевидностей про открытость и свободу «выстреливают», сколько ни повторяй. Это и хорошо — не надо напрягаться — и плохо: Стив Кост давно ушёл, а проект до сих пор выглядит как детский сад, инновации и нанотехнологии, даже для жителей развитых стран. Пора бы вырасти, но с ростом можно окончательно скатиться в маргинальность.

Тем временем, правительство США открыло сайт Map Give, посвящённый OpenStreetMap, Humanitarian OSM Team и диванной картографии. На примерах Гаити, Киберы и Филиппин видеоролики и статьи убеждают зарегистрироваться в нашем проекте и обклацывать домики в странах третьего мира, руководствуясь списком задач HOT. Прямее некуда, и инициатива от правительства: выше тоже некуда. Сайт убеждает по сотне человек в день, OpenStreetMap прирастает участниками.

Россия в рейтинге регистраций на шестом месте, за Францией и Италией. В новостях и в журналах нас упоминают пару раз в год. Нужно повышать узнаваемость бренда. Переведите, что ли, какие-нибудь важные статьи — например, про прошлогодний тайфун на Филиппинах, полностью проигнорированный этим блогом. Или как OpenStreetMap позволяет редактировать карту буквально каждому.

 10 комментариев   2014   hot   pr   статистика

Русский тагинфо

AMDmi3 и akks подняли на серверах Рамблера статистику тегов Taginfo для России и некоторых соседей. Теперь импорты (которых у нас не так много, как за рубежом) не будут портить таблицы. Отчёты сервиса показывают национальные особенности тегирования:

  • Россия: кладротеги висят на двухстах тысячах объектов (включая 30 тысяч точек, зачем-то); residential=rural вчетверо больше urban; префикс «ru:» в official_status не приживается; широко распространён загадочный тег utilization: похоже, его расставляет плагин для копирования адресов из кадастровой карты. Кому-то в Ростове-на-Дону удалось добавить тег с пустым ключом. Три самых популярных значения name, которые не названия улиц: «Сбербанк», «Продукты» и «Магнит».
  • Украина: половина тегов name продублирована на русском и английском языках; отношений street и associatedStreet втрое больше, чем в России, а addr:street непопулярен; много зданий и дорог импортированы из nadoloni.com; двум третям населённых пунктов проставлен код КОАТУУ, при этом village в 11 раз больше hamlet. Три популярных name: «Тополь», «Липа» и «Стохід» (это странно обрисованная речка).
  • Беларусь: две трети названий переведены на русский; 17% дорог имеют тег surface (это рекорд; в России — только 12%); place=hamlet встречается чаще, чем любое значение тега highway, и почти у всех населённых пунктов есть контур. Три популярных name: «Беларусбанк», «д.№» (?), «Шиномонтаж».
  • Эстония: семь самых популярных ключей связаны с недавним импортом домиков; вообще очень много следов разных импортов (адреса, некоторые города, корина), второе место среди тегов занимает загадочный «Type=0x13» (да, с заглавной буквы). Популярные недорожные name не установить, поскольку в стране не принято писать статусные части улиц: «Kooli» может означать как школу, так и школьную улицу.

В планах — перевести все адреса на поддомен taginfo.openstreetmap.ru, улучшить обрезку стран, сделать крупные обзорные карты и подкрутить разные константы: taginfo, явно, писался с прицелом на всю планету, и при загрузке небольшой её части вылезли недостатки.

 14 комментариев   2013   статистика

Толстый и тонкий

В начале марта Иван Мельников спросил в твитере: «это правда, что самое большое и маленькое здания в OSM — ошибки?» Давайте выясним.

Тег building — самый популярный в базе, если не считать бессмысленного source: 77 миллионов линий, 45% от всех линий OSM. Osmosis отфильтровал 80% планеты, оставив 3,8 гигабайта, которые osm2pgsql за два дня развернул в базу в 25 раз толще. То есть вся планета потребовала бы полтерабайта. Попутно я узнал, что в среднем на 10 зданий приходится 53 узла, без учёта общих точек (по отдельности получится около 60-61 узла, как пишет статистика гис-лаба). 1/4,4 всех точек в базе принадлежит зданиям, и лишь у 37 идентификаторы меньше миллиона.

Я обрабатывал отдельно отношения и линии. Первых оказалось совсем немного, 85 тысяч. Из трёх самых больших мультиполигонов зданий два — автозаводы близ Торонто: General Motors (563 тыс. м²) и Toyota (284 тыс. м²). Второе по размеру «здание» — крепостная стена Сианя, древней столицы Китая: 322 тыс. м². Все эти мультиполигоны правильные, хотя в Канаде одним контуром обведены по три здания, а стоит ли стену обозначать как building — непонятно.



На этой фотографии заснято самое большое по площади основания здание: фабрика Boeing в Эверетте, США. Официально 398 тыс. м², в OSM — 385, в пределах погрешности. Однако у нас оно не входит даже в первую сотню. Топ-5 на 14 февраля таков: Как видно, эта часть теории подтверждается. Теперь обратимся к другому концу рейтинга. Главная проблема с мелкими полигонами — что площадь некорректных геометрий (с самопересечениями, дубликатами рёбер и т. п.) вычисляется как очень малая, но не нулевая. Если верить сортировке по столбцу площади, то да, самые маленькие <любые типы объектов> — ошибки. Но интереснее найти настоящие здания. Таким среди мультиполигонов будет ромбовидное здание, созданное Komяpой: 0,026 м². После него идут два правильных, но очень маленьких мультиполигона в Жироне, Испания, площадью 0,48 и 0,55 м², и дом в Калифорнии с двухсантиметровым стенами (0,68 м²): его контур inner едва меньше outer.

Познакомьтесь с самым маленьким (на 14 февраля) зданием в OpenStreetMap: домик в Словакии площадью 0,023 мм². На карте он выглядит бледной точкой. Даже используя буферизацию, не удалось избавиться от всех кривых геометрий, но второе и третье места по площади занимают дома в Сан-Франциско: 1.8 и 3,2 мм². Остальные здания рекордных размеров вы можете поискать самостоятельно.

В итоге, как резюмируют на MythBusters, CONFIRMED: сколько ни исправляй ошибки, самые большое и маленькое здания в OpenStreetMap не соответствуют зданиям на местности.
 10 комментариев   2013   статистика

Нас обогнали

Когда два месяца назад Brian King поздравил народные яндекс.карты с двухсоттысячным участником, я заметил, что а) это количество тех людей, кто сделал хотя бы одну правку; б) оно очень похоже на другое число из статистики OSM. И да. Сегодня количество пользователей НЯК (215160) превысило количество участников OpenStreetMap, оставивших свой след в 26-гигабайтном файле планеты (215029).

Понятно, что общее число участников с правками у нас чуть за 300 тысяч, но если взять Россию, где работает Яндекс, то останется вдесятеро меньше. Так что это явный намёк на то, что пора перестать хвастаться зарегистрированными пользователями и прочими бессмысленными цифрами: это не наша сильная сторона. Но свободной лицензией размахивать тоже как-то не пристало в приличном обществе: не поймут. Чего же у нас остаётся хорошего?
 33 комментария   2013   няк   статистика

Первый на деревне

Кто-то любит рисовать домики. Бездумная, монотонная работа с немедленной отдачей. Сегодня нарисовал — завтра кто-то распечатал, вышел на улицу и расставил адреса, пользуясь контурами как подсказкой. После выходных наедине с building_tools тянет открыть статистику и увидеть себя на две-три ступеньки выше. Вот только в мировом масштабе ты — букашка, потому что некоторые люди обклацывают домики даже во сне, судя по числам. Поэтому нужно как-то ограничить территорию, даже не страной — городом.

Проект Тима Саттона из Linfiniti.com именно про это: выбираешь область, жмёшь «обновить» и радуешься своему имени в первой строчке рейтинга. Благодаря открытым исходникам на странице недавно появились графики по дням (правда, там явно не full history dump) и можно включить тепловую карту правок. Но все дополнительные критерии открывают неудобную правду, разделяя участников на тех, кто поддерживал город на протяжении нескольких лет, и кто только на выходные зашёл бинг пообклацывать. Чего стоит первое место, когда на втором и последующих — настоящие, верные городу местные мапперы? 
 12 комментариев   2013   статистика
Ранее Ctrl + ↓

Мнения, высказанные на этом сайте, отражают точку зрения лично автора сайта и ничью больше: ни его бывших или настоящих работодателей, ни семьи и знакомых.