38 заметок с тегом

статистика РСС

Дело о нотариусах

7 февраля, 20:58

(Фотография с пикабу)

Если кто-то хочет ввести в вики OpenStreetMap новый тег, нужно создать для него пропозал: страницу, объясняющую суть, модель тегирования и чем тег поможет. Процесс древний и хорошо документированный. Создав страницу, начните обсуждение в рассылку tagging@, через пару недель запускайте голосование, и его результаты покажут, насколько тег интересен другим мапперам. Правда, в рассылке живут около ста человек, голосуют 15-20, причём редко те же люди, которые тег потом будут использовать.

Пользователь Math1985 полгода назад проследил, как пропозалы, устаревания, картостиль и пресеты (заготовки) редакторов влияют на популярность тегов. Он воспользовался гениальной страницей Мартина Райфера, которая строит график популярности для любого количества тегов. Исследование Math1985 показало, что картостиль не влияет никак, вики влияет лишь поверхностно, а вот пресеты побеждают всё. Наиболее показателен случай shop=seafood против shop=fishmonger: в 2010 году первый победил второй в вики-голосовании, но благодаря Potlatch 2 и iD значений fishmonger было больше до 2014 года, когда пресеты в iD поправили.

Месяц назад один человек обозначил офис нотариуса как office=lawyer, а другой заметил это и вместо того, чтобы добавить уточняющий тег lawyer=notary, перетегировал в office=notary. Я про такой вариант не знал, на вопрос мне ответили, что этот тег указан в пресетах JOSM. Два тега для обозначения одного и того же — ненормально, поэтому углубляемся в историю.

В мае 2010 года в вики создали страницу для ключа office и 12 его популярных значений, включая office=lawyer. На странице для последнего сразу указали три возможных уточняющих тега, среди них — lawyer=notary. В тот месяц в рассылку tagging@ написали полтысячи писем, включая обсуждение shop=fishmonger, но не про office. Тем не менее, сразу после описания в вики на карте начали появляться офисы нотариусов, обозначенные задокументированной парой тегов.

Спустя четыре года, в марте 2014, пользователь CMartin отредактировал таблицу значений тега office, добавив туда пять строк, включая office=notary. На личное письмо он ответил, что обсуждения не было, он лишь внёс заметные значения из таблицы Taginfo. Через полгода строчку в таблице заметили и в её описании сослались на устоявшийся способ тегирования: office=lawyer. В таком виде список провисел до ноября 2016 года, когда Math1985 заменил его на автогенерируемый из Taginfo.

В ноябре 2015 года Klumumbus вытащил список значений office в заготовки JOSM. К этому моменту в базе было примерно 240 тегов office=notary против 860 lawyer=notary. Разумеется, после выхода новой версии JOSM первый график рванул вверх, а второй замедлился. На этот момент первый ещё не вырвался вперёд: у нас 925 office и 1020 lawyer. Росту способствовала и короткая вики-страница тега, которую, не разобравшись, создал Math1985. Он даже не упомянул альтернативный тег.

Ошибка налицо, в январе этого года я решил её исправить, создав тикет в JOSM на замену тега в заготовках. Увы, это непросто: подошёл человек из Бразилии и рассказал, что там нотариусы не являются юристами. Klumbumbus подхватил его мысль, предложив, если что-то не нравится, пройти в рассылку tagging@. Железный аргумент, фиг оспоришь. А остановки — не дороги, почему они в highway? Или почему аптеки — amenity, когда там торгуют?

Другими словами, название тега и значение тега — разные вещи. BushmanK целый год по-всякому объясняет это в своём дневнике. Проблема здесь не в обозначении, а в двух тегах для одного и того же. Благодаря бездумному копированию из таблиц, оба набора тегов теперь используются примерно одинаковое количество раз. Именно это я хочу исправить: давайте выберем один и будем его придерживаться. И у office=notary нет никаких преимуществ, кроме присутствия в заготовках JOSM.

Борьба продолжается: я только что написал в рассылку tagging@ и не ожидаю, что все её читатели легко согласятся. Впереди, наверное, и пропозалы, и голосования. Тем временем, влияние JOSM на статистику должно ослабнуть. Не потому, что началась дискуссия. А потому что в редакторе iD в субботу тоже добавили пресет для нотариуса. С правильными тегами.

Вожделенная галочка

18 января, 17:59

Два сайта статистики пользователей должен знать каждый русскоязычный маппер: stat.latlon.org с рейтингом по правкам и HDYC с россыпью чисел. Весной прошлого года на последнем у некоторых участников появились галочки « ✓ подтверждённый». Как добавить такую в свой профиль? Паскаль Найс объяснил по шагам:

  1. У вас должно быть не менее 100 пакетов правок.
  2. Зарегистрируйтесь на форуме, на сайте помощи (подойдут логин и пароль с osm.org) и в вики.
  3. Перечислите ссылки на все свои аккаунты в профиле на сайте OpenStreetMap.

Пример заполнения есть в блоге malenki. Спустя сутки зелёная галочка появится в вашей странице HDYC. На сегодня сайт собирает статистику из восьми источников, полный список смотрите, например, в моём профиле.

Календарь активности а-ля гитхаб Паскаль добавил в августе, и он привлекает внимание сильнее чисел. В теме «ни дня без OpenStreetMap» мы нашли людей, кто в прошлом году правил карту каждый день: их шесть человек. И ещё двое, как видно на диаграмме freeExec, продержались до осени.

Статистика по редакторам

12 января, 12:49

Страницу Editor usage stats в нашей вики до 2015 года время обновлял немецкий маппер Oli-Wan. Он не только заполнял рейтинги редакторов по правкам и пользователям, но и рисовал графики и анализировал изменения. Прошлым летом, интересуясь успехами MAPS.ME, я написал скрипт для подготовки таблиц, и на этой неделе обновил их: теперь данные за 2016 год полны.

Первая и бесполезная таблица — рейтинг по количеству пакетов правок — доносит не количественную, а качественную информацию. Например, что Redaction Bot (скрипт для сокрытия правок после нарушений условий участия) в этом году сделал 450 правок, а 2014 и 2015 — по 250. Или что нашёлся человек, который зачем-то загрузил пакет правок через редактор iLOE, который давно убран из аппстора и не поддерживается с 2011 года.

Теория, что пользователи iD делают больше пакетов правок, чем пользователи JOSM, числами не подтверждается: в среднем 28,5 ченджсетов на пользователя в iD против 143,8 в JOSM. Конечно, причина этого в более низком показателе удержания пользователей у веб-редакторов: многие уходят после первой правки. Если заглянуть в третью таблицу, в JOSM пользователи делают в среднем 195 правок на пакет, а в iD — только 45. Интересен редактор Pushpin, у которого в 15187 пакетов разложена 15091 правка.

Пользователи

Рейтинг по пользователям говорит, что пользователи есть у всех. У редактора ArcGIS их в этом году рекордно много после затяжного падения с 2011 года, хотя до RawEdit он не дотянул. Обошёл его новичок GNOME Maps: в прошлом году в это приложение добавили редактирование заведений, но, кажется, заметили эту функцию немногие. Мобильный редактор Pushpin неожиданно упал в числе пользователей: вероятно, красоту и удобство затмила дата последнего обновления — 2012 год. Его также неожиданно обогнал сайт OsmHydrant, непрерывно привлекающий новых редакторов последние три года.

Интересна борьба Merkaartor с Potlatch 1. Несмотря на то, что развитие второго остановилось в 2010 году, а первый недавно вернулся к жизни силами Ладислава, число их пользователей примерно одинаково последние четыре года. И если поклонники быстрого и необычного редактора не соберутся поведать о нём миру, скоро его по числу пользователей обгонит даже Level0.

На фоне постоянного количества пользователей JOSM (~23 тысячи последние пять лет) и медленного роста iD, едва покрывающего падение Potlatch, заметен резкий старт MAPS.ME: почти сто тысяч пользователей за девять месяцев. К сожалению, он не вышел на первое место, но 37% от общего числа редакторов — заметная доля. Рост доли мобильных редакторов подтверждает и OsmAnd, в прошлом году c 3,5 тысячами пользователей окончательно оторвавшийся от Vespucci и обогнавший даже WheelMap.

Тренд заметить несложно. Из девяти редакторов с долей выше полупроцента (и тысячами пользователей) пять мобильные. Гуманитарная команда, сильнее других привлекающая новых пользователей в OpenStreetMap, постепенно переходит на мобильные приложения: OpenMapKit и MAPS.ME. Поэтому в этом году вероятно не только отсутствие роста, но даже падение количества пользователей редактора iD. Если OsmAnd перетащит редактор из подключаемого модуля в основное приложение, у него есть шанс обойти Potlatch 2.

Правки

Можно понять bulk_upload.py в шестой строчке таблицы рейтинга по количеству правок: им пользуются десять человек из DWG для массовых откатов. Можно понять 146 тысяч правок в Level0: он удобен для пакетной замены тегов. Но откуда у RawEdit 22 тысячи правок? Он же в базовом варианте не позволяет загружать больше одного объекта. Через редактор Mapzen, который нужно собирать из исходников, в прошлом году четыре человека поправили семь объектов. Видимо, не понравился.

Сумма правок через первые три настольных редактора не изменяется уже три года: около 850 млн объектов в год. Те 23 тысячи пользователей JOSM сдают: правок у них всё меньше и меньше. А вот 400 пользователей Merkaartor продолжают держать его на пятом месте по правкам.

Мобильные редакторы не могут сравниться с настольными по количеству правок, не в последнюю очередь из-за импортов. Но если сравнивать в категориях, где править с телефона удобнее, то есть, в правке заведений и адресов, то мобильные редакторы показывают себя достойно. Редакторы под iOS теряют в правках, а под Android показывают заметный рост. Поздравляем OsmAnd, наконец обошедший ArcGIS и Potlatch 1.

Что нам говорит отсутствие роста правок в последние три года? Точно не о застое в проекте: количество пользователей за год увеличилось на треть. Скорее о том, что состояние дорожной сети и домиков в большинстве регионов с активными картографами уже удовлетворительно, и всё меньше европейцев набегают на города с желанием обрисовать всё-всё. Мапперы переключаются на задачи, не плодящие большого количества правок: прежде всего, адресацию, атрибуты дорог и добавление POI. В дневничках постоянно проходят заметки про добавленные этажность зданий, полосы на дорогах, названия съездов на магистралях. Вместо визуальной полноты мы теперь занимаемся важными для практических задач атрибутами — и OpenStreetMap всё быстрее движется к статусу самой полезной карты.

Насорили и ушли

6 марта 2015, 11:46

Jochen Topf снова обновил Taginfo. На странице каждого ключа появилась вкладка «Similar» («Похожие») со списком ключей, которые похожи на выбранный, но с опечатками, префиксами и суффиксами. Оттуда можно узнать, например, о 153 ключах _amenity_, 14 тысячах buildingpart, 1155 nature. Новый отчёт сопоставляет самые популярные ключи с самыми редкими вариантами их написания.

Также автор сделал временные графики с зависимостями количества ключей, тегов (пар ключ=значение) и типов отношений от времени. Первый и последний графики понятны: чем дальше, тем шире воображение у мапперов, — а во втором, где счёт на десятки миллионов, неожиданные скачки. Так, в декабре пропали несколько миллионов тегов, а в апреле-мае скорость добавления новых тегов была раза в три выше обычной, увеличив их количество на десять миллионов.

Jochen призывает не закрывать отчёты, а пойти и поправить опечатки в тегах. В Taginfo это просто: на странице ключей есть кнопки JOSM и Level0, в которых легко переименовать ключ на всех объектах, загрузить правку в базу и перейти к следующей строке отчёта.

Пара парней-дизайнеров удалилась

8 сентября 2014, 0:00

Закрыв OSMRanking, группа altogetherlost нашла, куда пристроить свой более популярный сервис статистики OSMStats. Теперь им заведует Паскаль Найс, известный своими тематическими картами. Разумеется, он не преминул покопаться внутри сервиса, добавив выбор даты, статистику по ченджсетам и графики за год для стран и активных участников. Работа недизайнера заметна с первого взгляда: пропали градиенты и тени, а дату выбирать, мягко говоря, неудобно.

Заглянуть в planet.osm

27 июня 2014, 17:24

Главное в визуализации плотности данных — выбрать правильные цвета. Мартин Райфер снова посчитал плотность точек на тайл 13 масштаба для всего мира, опубликовав не только две картинки, но и интерактивную карту. Смотреть её нужно исключительно на предельном зуме, исследуя завораживающие текстуры горящей Германии, теряясь в паутине Сибири, утопая в черноте Атлантического океана и домысливая картинку за гранью импортированных квадратов в Канаде. Эта карта, почти, но не совсем, непохожая на спутниковый снимок, как будто что-то говорит нам об OpenStreetMap и её участниках, — но нет, показалось.

Воскресенье потерь

26 июня 2014, 21:37

Главный блог OpenStreetMap (заголовки переводов которого выведены в левую панель штосма) выглядел живым преимущественно из-за еженедельных сводок Паскаля Найса и Денниса Зилстры. Уже нет: в воскресенье опубликован последний выпуск, редакторы устали и уходят. Как подтверждение, что новости никто не читает, сожаление в комментариях выразили лишь трое человек. Других заметок в блоге за этот год опубликовано шесть, если не считать новогоднего поздравления, все — зимой. Последним новостным блогом с регулярными обновлениями остался немецкий, который ведёт толпа из десяти человек. Месяц назад он отпраздновал двухсотую заметку статьёй про ведение блога. Его твитер, увы, тоже сдулся: хоть и выглядит живым, но лишь анонсирует заметки в блоге и ретвитит фигню.

Неуловимая команда дизайнеров AltogetherLost в то же воскресенье объявила, что закроет сервис OSMRanking. Люди сразу возмутились: как же так, хороший сервис, всё время там статистику смотрим. Никто не упоминал названия, но дизайнеры почувствовали непонимание и пояснили: остановят кривоватый OSMRanking, а всеми любимый OSMStats продолжит работу.

Утром 16 июня GaM огорчил велосипедистов, пользовавшихся его модификацией гарминосборки всей России: перейдя на андроид, он потерял к ней интерес и забросил. Несмотря на панегирики пользователей, он отказался открыть исходники стиля, хотя автор исходной сборки, от которой форкнул свою GaM, считает, что по лицензии должен был. Пользователи ушли в тему сборки Макса Васильева, где помогают улучшить её отображение на мелких экранах навигаторов.

Сегодня я обнаружил, что двумя воскресеньями ранее Роберт Лайп, автор GPSBabel, поправил, наконец, номер версии формата OpenStreetMap в своей программе (был 0.5, хотя формат не отличался от современного; новый релиз ещё не выпустили). Я иногда пользовался ею для преобразования из GPX в OSM: JOSM зачем-то разделяет трек и вейпоинты, и не даёт сделать слой OSM из последних. Комментарий к правке кода обескураживает: «поскольку этот формат почти не используют, видимо, поддержку OSM мы прекратим».

Есть и хорошая новость, одна: Алексей Илларионов оживил Mapzen POI Collector для андроида, поправив несколько ошибок, русский перевод и панель действий. Он обещает продолжить работу, если программа кому-нибудь пригодится.

#нозачем

16 января 2014, 10:39

Каждый раз, когда я рассказываю про OpenStreetMap, собеседник спрашивает: «а почему бы просто не открыть карту Google?» С практической точки зрения это логичный вопрос, но здесь важна не только практичность, но и то общество, которое мы приближаем своим выбором.

Serge Wroclawski в начале месяца сочинил заметку «Зачем миру нужен OpenStreetMap»: по сути, список причин, почему гугль плохой, а OSM хороший. Самые азы, любой участник нашего проекта расскажет не хуже, хотя с написанием текстов у русских швах. Обычно такие заметки, нередко пробегающие в блогах участников и в официальном блоге, остаются незамеченными. Но не в этот раз: Serge обнаружил боле 120 тысяч уникальных посещений статьи, ошеломительные числа ретвитов, шеров, лайков, голосов и упоминаний, публикацию на Gizmodo и, позавчера утром, свою статью на сайте популярной английской газеты The Guardian со смешными иллюстрациями.

Популярность заметки показала не только заинтересованность людей в OSM, но и то, что проект до сих пор неизвестен. Будучи активным участником уже четвёртый год, я считаю моветоном рассказывать об основах OpenStreetMap на широкую публику: мол, это как википедия, но про карты (в чатике #osm обсуждали наивный, но резонный вопрос из комментариев к статьям: а как же викимапия тогда?). Сколько можно? Проект растёт каждый год, Саймон Пул, наш новый лидер, в новогоднем поздравлении поделился ощущением, что использование OSM гигантами вроде Bosch, Garmin, Mercedes уже не воспринимается как потрясение, а просто встаёт в ряд хороших новостей. «Мы должны постоянно напоминать себе, что мы, участники маленького открытого проекта, удивительным образом проникаем в ниши, доселе открытые лишь для государственных предприятий и гигантских корпораций».

И тут — «вы не властны над составом карты Google, и компания скопила подозрительно много информации, того и гляди сотрут вас с карты: пользуйтесь OpenStreetMap, картой, которую может править каждый!» Удивительно простодушная заметка, которую я собрался было перевести для хабра, чтобы провести эксперимент с измерением её популярности в России, но не смог из-за зияющих логических дыр, которые обнажились бы при переводе (или из-за недостаточного знания языка). Но заметка-то популярна! Какая разница, кто чуть не монополизировал время в XIX веке, если текст трогает сотни тысяч читателей, процент которых комментирует не формулировки, а суть заметки, всё теми же знакомыми каждому фразами «ничего не знаю, мой дом есть на Google Maps» и «мне очень понравился OSM в моей прошлой велопоездке». Активисты OpenStreetMap окучивают комментаторов, убеждая их поправить карту, и количество регистраций из Великобритании и США едва ли не впервые превысило этот показатель для Германии. Статьи про способы использования карты и анализ геоданных не работают, потому что адресованы редким читателям. Срыв покровов и долбёжка очевидностей про открытость и свободу «выстреливают», сколько ни повторяй. Это и хорошо — не надо напрягаться — и плохо: Стив Кост давно ушёл, а проект до сих пор выглядит как детский сад, инновации и нанотехнологии, даже для жителей развитых стран. Пора бы вырасти, но с ростом можно окончательно скатиться в маргинальность.

Тем временем, правительство США открыло сайт Map Give, посвящённый OpenStreetMap, Humanitarian OSM Team и диванной картографии. На примерах Гаити, Киберы и Филиппин видеоролики и статьи убеждают зарегистрироваться в нашем проекте и обклацывать домики в странах третьего мира, руководствуясь списком задач HOT. Прямее некуда, и инициатива от правительства: выше тоже некуда. Сайт убеждает по сотне человек в день, OpenStreetMap прирастает участниками.

Россия в рейтинге регистраций на шестом месте, за Францией и Италией. В новостях и в журналах нас упоминают пару раз в год. Нужно повышать узнаваемость бренда. Переведите, что ли, какие-нибудь важные статьи — например, про прошлогодний тайфун на Филиппинах, полностью проигнорированный этим блогом. Или как OpenStreetMap позволяет редактировать карту буквально каждому.

Русский тагинфо

25 мая 2013, 13:32

AMDmi3 и akks подняли на серверах Рамблера статистику тегов Taginfo для России и некоторых соседей. Теперь импорты (которых у нас не так много, как за рубежом) не будут портить таблицы. Отчёты сервиса показывают национальные особенности тегирования:

  • Россия: кладротеги висят на двухстах тысячах объектов (включая 30 тысяч точек, зачем-то); residential=rural вчетверо больше urban; префикс «ru:» в official_status не приживается; широко распространён загадочный тег utilization: похоже, его расставляет плагин для копирования адресов из кадастровой карты. Кому-то в Ростове-на-Дону удалось добавить тег с пустым ключом. Три самых популярных значения name, которые не названия улиц: «Сбербанк», «Продукты» и «Магнит».
  • Украина: половина тегов name продублирована на русском и английском языках; отношений street и associatedStreet втрое больше, чем в России, а addr:street непопулярен; много зданий и дорог импортированы из nadoloni.com; двум третям населённых пунктов проставлен код КОАТУУ, при этом village в 11 раз больше hamlet. Три популярных name: «Тополь», «Липа» и «Стохід» (это странно обрисованная речка).
  • Беларусь: две трети названий переведены на русский; 17% дорог имеют тег surface (это рекорд; в России — только 12%); place=hamlet встречается чаще, чем любое значение тега highway, и почти у всех населённых пунктов есть контур. Три популярных name: «Беларусбанк», «д.№» (?), «Шиномонтаж».
  • Эстония: семь самых популярных ключей связаны с недавним импортом домиков; вообще очень много следов разных импортов (адреса, некоторые города, корина), второе место среди тегов занимает загадочный «Type=0x13» (да, с заглавной буквы). Популярные недорожные name не установить, поскольку в стране не принято писать статусные части улиц: «Kooli» может означать как школу, так и школьную улицу.

В планах — перевести все адреса на поддомен taginfo.openstreetmap.ru, улучшить обрезку стран, сделать крупные обзорные карты и подкрутить разные константы: taginfo, явно, писался с прицелом на всю планету, и при загрузке небольшой её части вылезли недостатки.

Толстый и тонкий

15 марта 2013, 22:18

В начале марта Иван Мельников спросил в твитере: «это правда, что самое большое и маленькое здания в OSM — ошибки?» Давайте выясним.

Тег building — самый популярный в базе, если не считать бессмысленного source: 77 миллионов линий, 45% от всех линий OSM. Osmosis отфильтровал 80% планеты, оставив 3,8 гигабайта, которые osm2pgsql за два дня развернул в базу в 25 раз толще. То есть вся планета потребовала бы полтерабайта. Попутно я узнал, что в среднем на 10 зданий приходится 53 узла, без учёта общих точек (по отдельности получится около 60-61 узла, как пишет статистика гис-лаба). 1/4,4 всех точек в базе принадлежит зданиям, и лишь у 37 идентификаторы меньше миллиона.

Я обрабатывал отдельно отношения и линии. Первых оказалось совсем немного, 85 тысяч. Из трёх самых больших мультиполигонов зданий два — автозаводы близ Торонто: General Motors (563 тыс. м²) и Toyota (284 тыс. м²). Второе по размеру «здание» — крепостная стена Сианя, древней столицы Китая: 322 тыс. м². Все эти мультиполигоны правильные, хотя в Канаде одним контуром обведены по три здания, а стоит ли стену обозначать как building — непонятно.



На этой фотографии заснято самое большое по площади основания здание: фабрика Boeing в Эверетте, США. Официально 398 тыс. м², в OSM — 385, в пределах погрешности. Однако у нас оно не входит даже в первую сотню. Топ-5 на 14 февраля таков: Как видно, эта часть теории подтверждается. Теперь обратимся к другому концу рейтинга. Главная проблема с мелкими полигонами — что площадь некорректных геометрий (с самопересечениями, дубликатами рёбер и т. п.) вычисляется как очень малая, но не нулевая. Если верить сортировке по столбцу площади, то да, самые маленькие <любые типы объектов> — ошибки. Но интереснее найти настоящие здания. Таким среди мультиполигонов будет ромбовидное здание, созданное Komяpой: 0,026 м². После него идут два правильных, но очень маленьких мультиполигона в Жироне, Испания, площадью 0,48 и 0,55 м², и дом в Калифорнии с двухсантиметровым стенами (0,68 м²): его контур inner едва меньше outer.

Познакомьтесь с самым маленьким (на 14 февраля) зданием в OpenStreetMap: домик в Словакии площадью 0,023 мм². На карте он выглядит бледной точкой. Даже используя буферизацию, не удалось избавиться от всех кривых геометрий, но второе и третье места по площади занимают дома в Сан-Франциско: 1.8 и 3,2 мм². Остальные здания рекордных размеров вы можете поискать самостоятельно.

В итоге, как резюмируют на MythBusters, CONFIRMED: сколько ни исправляй ошибки, самые большое и маленькое здания в OpenStreetMap не соответствуют зданиям на местности.
Ctrl +  Ранее