Позднее Ctrl + ↑

State of the Map 2018

В понедельник закончилась конференция SotM в Милане. Три дня докладов в три потока, четыреста человек среди итальянской архитектуры. Эта ежегодная конференция — как новый год и день независимости для каждого участника OpenStreetMap, главный праздник в году. Только здесь можно понять масштаб сообщества, поговорить со всеми, кого обычно видишь только как буквы в интернете, рассказать про свои проекты людям, которые по-настоящему их оценят.

На ютубе вживую транслировались доклады из двух основных залов (их сейчас нарезают), а в телеграме, как раньше с FOSS4G, мы делились впечатлениями и публиковали фоточки. Если пропустили, идите и читайте: там не так много, и вместе с тем, есть новости. Хорошие доклады — это не те, из которых узнаёшь про полезный софт, а которые приносят новые идеи. Хорошо, что телеграм позволяет их сразу записать. И хорошо, что теперь не нужно писать отчётные заметки в блоге: они уже готовы.

Как замечают в других блогах, на этой конференции нельзя было не выделить нескольких основных тем. И отсутствия других.

  • Векторные тайлы — наше будущее. Но нафиг такое будущее, если это векторные тайлы от Mapbox. Надеюсь, что мы изобретём что-нибудь повеселее. Например — внимание! — векторные осмотайлы! Ну и что, что мы их уже делали десять лет назад для Osmarender, ведь новое — хорошо переосмысленное старое. Почитайте телеграм, опять же.
  • Общественный транспорт снова пора переделывать. Из пяти моих выступлений на конференции три были про транспорт. Сейчас сообщество обсуждает пропозал, ранее известный как PTv3. Он позволит снова мапить автобусные остановки как highway=bus_stop.
  • Главные картографы и потребители — Apple, Facebook, Microsoft. Пока вы спали, «традиционные» осмерские компании типа Mapbox и Geofabrik отошли на второй план, а проектом начали заправлять корпорации. Они — лицо редакторов OpenStreetMap нынче. Хотели знаменитых компаний в пользователях? Ну вот, получите. Миллионы долларов, тысячи редакторов, нет повода не радоваться.
  • Внесение данных снова в фокусе. Мы, было, подумали, что данные OpenStreetMap уже достаточно хороши и можно переключиться на более важные задачи, типа адекватного QA. Но нет, теперь нам нужны те же щи, но погуще: машинное обучение (нейросеточки из каждого утюга), картографические роты, ковровые импорты, боты. Данные оказались достаточно хороши, чтобы привлечь внимание больших игроков — а те уже подтягивают данные до своего уровня. А хорошего QA ещё ждать и ждать, написать его могут три человека во всём мире, и они заняты.
  • Несмотря на отсутствие улучшений, тема гендерного равенства растёт: уже две дискуссионных сессии, одна из которых в главном зале, плюс много небольших докладов. Хочется ощущать, будто количество вот-вот перейдёт в качество, но пока что получается лишь больше количества.
  • Почти не было тем про мобильные приложения. Новости разработки Vespucci, OsmAnd — и всё. Куда всё делось, где бравые призывы mobile first? Непонятно.
  • И не было никаких революций. Никаких «через сто лет мы будем жить при API 0.7», ни обещаний потрясений. Стив Кост пришёл со своей проповедью об адресах, которую мы слышали шесть лет назад, да и всё. Мы ж теперь серьёзные и представительные. Сейчас только аккуратненько тайлы заменим на такие же.

Общую фоточку участников вы уже видели в WeeklyOSM. На ней несложно найти Вову, Виктора и Дмитро, чуть сложнее — меня в голубой рубашке, а Тимофея я так и не заметил. В блогах и дневничках понемногу появляются отзывы, как от компаний со сдержанным корпоративным восхищением собственными докладами, так и от участников, в частности, scholars, чью поездку оплатил OSMF и кого специально просят отозваться.

Мы небольшой русскоязычной компанией собрались во второй день конференции вечером, чтобы поговорить об услышанном и о будущем OpenStreetMap. Получился полуторачасовой подкаст, своеобразный отголосок «Радио OSM». Если у вас нет времени слушать, то ссылка ведёт не на файл mp3, а на транскрипт, текстовую версию подкаста (но ссылка на mp3 там тоже есть). То есть, с помощью волшебного переводчика гугля мы получили и английскую версию: можно удивлять наших зарубежных друзей радикализмом русских идей. «До основанья и затем», такого рода. Послушайте, там хорошо.

Следующая конференция пройдёт в конце сентября 2019 года в Гейдельберге. Да, том самом, где стоит университет, подаривший нам OpenMapSurfer и OpenRouteService. Конечно, до того времени будет много конференций поближе. Например, украинская NaviMotive или белорусская ByGIS. Будут ли конференции в России? Будут ли в каком-нибудь городе отмечать 12 августа день рождения OpenStreetMap? Это вам решать.

Моря коричневых квадратиков

Вы, наверное, слышали об инициативах HOT, особенно о серии картовстреч Missing Maps. Добровольцев сажают за JOSM и учат обклацывать домики в Центральной Африке. Результатом становятся сотни тысяч контуров с building=yes, которые аналитики используют для планирования акций помощи.

Jean-Marc Liotier намедни задал вопрос, столько неожиданный, сколько и очевидный: а зачем это всё? Добровольцы оставляют жутко неточную карту, на которую опытный осмер без слёз не взглянет. Дороги недорисованы, POI отсутствуют, будущим африканским мапперам будет проще удалить это всё и начать с нуля.

Зачем вообще рисовать контуры? Для анализа населённости достаточно нарисовать полигон landuse=residential с атрибутом плотности. На крайняк — вместо контуров ставить в центре домиков точки со всеми нужными тегами. У аналитиков будет способ посчитать население, а карта не пострадает. Зачем тратить время и силы ценного человеческого ресурса на работу, которую осмеры захотят удалить?

Для зарождающегося африканского сообщества эти недокарты вообще мина: здесь не кривые линии дорог нужно выправлять, как после импорта TIGER американцам, здесь каждый домик нужно скрупулёзно передвигать на правильное место. Любой, кто этим занимался, схватится за голову.

В рассылках вопрос поддержали опытные осмеры, а члены HOT ответили, но как-то не по существу. Про пользу да про валидаторов, которых всегда не хватает, потому что это не так интересно. Нет вопроса о пользе карты для кого-то, кроме аналитиков HOT, в справочнике команды. Никто не подумал. Проблемы не белых людей.

Один из вариантов ответа: встречи Missing Maps — отличный способ завербовать далёких от картографии людей в OpenStreetMap. Научить их редактированию и показать осязаемую пользу от работы. Да, качество их домиков будет ниже плинтуса, но если мы берём за цель их участие в сообществе, то то, что они нарисуют, можно удалить. Главное, что человек завяз.

Работа гуманитарной команды поднимает сразу несколько вопросов. Например, чем сотни тысяч нарисованных добровольцами домиков лучше автоматического импорта домиков из сторонней базы (тут как раз Bing пожертвовал 125 миллионов)? Наши правила запрещают массовые правки без обсуждения, но здесь же живые люди обклацывают снимки. Да, качество так себе, да, придётся большую часть удалить. При этом, сообщество не приемлет автоматические правки и импорты. Главный аргумент — потому что данные из сторонних источников всегда уступают тёплым ламповым нарисованным вручную домикам.

Впрочем, организованное редактирование скоро тоже зарегулируют новым регламентом. Он гласит, что если вы собрались больше трёх, то посчитаем это импортом: косо посмотрим, сплюнем, спросим за район.

Почему появился этот регламент? Некоторые компании начали платить мапперам за улучшение карт густо населённых районов, и осмеры из этих районов возмутились. Импорты и организованное редактирование никого не волнуют, пока не нарушают главное правило: только не на моём участке. Стоит задеть территорию опытного осмера, как узнаешь про много разных правил и ограничений. Классы дорог не трожь, используй contact:website вместо website, каждый POI должен быть проверен на местности и подтверждён нотариально заверенной фотографией. Правило «Не на моём участке» в сообществе идёт первым, до лицензии и проверяемости. Гуманитарной команде позволяют работать в Африке только потому, что там нет увлечённых мапперов, которые от очередного набега придут в ужас.

Наконец, проблема сотен тысяч домиков поднимает через Жана-Марка тот же вопрос, какой должен задавать себе каждый из нас: зачем мы картируем? Чем мы руководствуемся при выборе тегов и объектов для картирования, и какой конечный результат покажет нам, что мы выполнили свою работу хорошо? Линия на стандартном картостиле? Слово «МакАвто» в результатах поиска на смартфоне? Размер файла с выгрузкой города? Числа в валидаторе? Какой бы ни была ваша метрика, не бойтесь поделиться ею на форуме или в чатике: вам не только помогут найти лучшие источники и модули редакторов для работы, но и объяснят, почему ваша работа не имеет смысла. Мы всегда рады помочь.

2018   hot   ВНЕЗАПНО

Знаки

Вчера на форуме в очередной раз высказали мнение, что будущее открытой картографии — за автоматическим распознаванием. Несколько компаний исследуют это направление уже много лет. Самая заметная из них — Mapillary, «народные панорамы». Дождавшись, когда база фотографий подрастёт до сотен миллионов, они начали выяснять, что же на них запечатлено. В январе 2015 года Mapillary показали слой с дорожными знаками и спустя несколько месяцев добавили его в JOSM и iD.

Две недели назад они анонсировали большое обновление набора дорожных знаков. За это время от машинного зрения они перешли к машинному обучению, прокатали через него на порядок больше снимков, а в октябре ещё и запустили «игру», в которой человеку нужно оценить точность распознавания.

Telenav с их конкурирующим проектом OpenStreetCam занимается примерно тем же — но с конкретной целью улучшить OSM, а не только собрать базу «на всякий случай». Филипп Кэндал, руководитель разработки, рассказал в 2016 году, что его команда пишет распознавалку знаков и указателей и уже уточнила двадцать тысяч ограничений на карте. За автоматикой, по его словам, будущее.

Для картографов OSM знаки в плагинах Telenav появились только в феврале этого года: всего полмиллиона и лишь в США и Канаде. Зато они сравнивают распознанные ограничения с данными OpenStreetMap, и картографов можно оповестить о необходимости уточнить карту. В апреле эту функциональность добавили в модуль для JOSM.

Наконец, в мае Telenav снова признался в верности открытому сообществу, опубликовав весь код распознавания знаков и натренированную модель под открытой лицензией Mozilla. Саму базу знаков тоже скоро откроют. Мартайн предлагает задействовать эту нейросеточку для распознавания новых типов объектов: скамеек, фонарных столбов, остановок. Чтобы это открытие не прошло незамеченным, Telenav объявил конкурс: сделайте свой проект до 17 августа и выиграйте 10 тысяч долларов — если он распознает более 94% объектов. Условия расплывчаты — вероятно, более опытные участники таких конкурсов поймут, что к чему.

А что Mapbox? Странным образом, они тоже участвуют в этом ажиотаже — но до недавнего времени только командой картографии. В 2016 году они собрали интерактивную карту, сопоставляющую знаки от Mapillary и данные OSM (что Telenav, напомним, делает автоматически) и улучшали нашу карту — только в США, конечно. 13 июня этой карте пришёл конец, хотя все исходники доступны на github. А на следующий день Вирджиния из команды машинного обучения Mapbox раскрыла, что они взяли у Bing снимки StreetSide на 23 американских города, прогнали их через нейросеточки и получили новую интерактивную карту со 184 тысячами распознанных ограничений движения. Их команда картографов медленно продирается через этот набор данных, но от помощи они не откажутся.

Все эти компании распознают знаки на фотографиях, но автоматизируют только это — и, иногда, сопоставление с ограничениями в OpenStreetMap. А внесение в базу геоданных — ни-ни. Отчасти потому, что знаки не соответствуют никаким объектам на карте, они лишь задают свойства для уже существующих дорог. Причём не всегда привязанные к координатам знаков. Сопоставлять знаки и карту непросто, тем более, если с целью карту улучшить.

Другая причина — сообщество OSM не разделяет мнение Филиппа, что автоматическое распознавание — будущее картографии. Лучше в сто раз медленнее, но руками, с тёплыми ламповыми ошибками и чувством удовлетворения от работы, неведомым алгоритму. Фейсбук уже несколько лет пытается переломить это заблуждение — на конференции SotM в Милане через месяц они снова расскажут, как взаимодействуют с сообществом в Таиланде, куда импортируют распознанные нейросетями дороги.

Внезапные панорамы

Месяц назад в репозитории редактора iD неожиданно появился пул-реквест от Джубала Харпстера. В описании он был лаконичен: «интегрирует снимки StreetSide в редактор. На здоровье. —Микрософт». «Но их же нельзя использовать», — сразу ответил Пол Норман.

Мало кто в восточном полушарии знает, что панорамы есть не только у Google, Яндекса и Baidu. Список подобных сервисов в википедии очень длинный, но в разделе всемирного покрытия пока только две компании с проприетарными панорамами. Вторая — это Microsoft Bing. Их StreetSide запущен в 2009 году и покрывает большую часть Соединённых Штатов и крупные города в Великобритании, Франции и Испании. Вы не увидите эти снимки: «Вид с улицы» доступен только жителям городов внутри области покрытия.

Смотрители проекта iD не так въедливы, как у сайта OSM. Брайан просмотрел на эти семь коммитов от Шоны Паради и Лорена Мюллера, нашёл несколько недочётов и то ли помог их исправить, то ли отредактировал код сам — интерфейс гитхаба не дал понять. Так или иначе, неделю назад запрос был принят, и 14 июня выпущена новая версия редактора с панелью StreetSide. Включается она там же, где Mapillary и OpenStreetCam: кнопкой данных карты, справа под кнопкой слоёв.

Что касается лицензии, Пол немного опоздал с заявлением. Как обнаружил Майкл Райхерт, ещё в апреле Микрософт обновил условия использования своих сервисов, явно разрешив подсматривать в StreetSide для уточнения данных. Немцам, впрочем, от этого мало пользы: их соотечественники успешно отразили все попытки Bing Maps отснять их территорию.

Разумеется, разрешение касается не только редактора iD. В том же пул-реквесте Джубал ответил на несколько вопросов насчёт лицензии, подтвердив, что панорамы можно использовать и в настольных редакторах. Несложно найти код модуля для JOSM, на которым последние несколько дней работает Рене Роудс. Полноценной поддержки придётся подождать в обоих редакторах: вон, в модуле для iD уже нашли ошибку при масштабировании снимка.

Как сотрудники Bing Maps напоминают в пресс-релизе, это не первый их подарок сообществу открытых карт. Каждый пользовался снимками Bing для обклацывания домиков и дорог. Из недавнего, год назад они предоставили OpenStreetMap десять миллионов геометрий зданий в 44 штатах Америки вместе с высотами, которые нарисовали самостоятельно по детальным снимкам и ЦМР. Приятно, что Микрософт уже много лет не отворачивается от открытых сообществ. Спасибо им.

«Этот пользователь является вандалом»

Вчера на нашем сайте появились многословные ссылки «сообщить об этой ...». Их можно найти у каждой статьи в дневнике и комментариев к ней, у пользователей и у заметок на карте. При нажатии вы получите форму жалобы модератору, где нужно оценить содержимое текста или профиля (спам, непристойности, угрозы). Со страницы заметки на карте можно пожаловаться на раскрытие личных данных, а у пользователя — пожаловаться на вандала. Жалоба попадёт в ленту, доступную модераторам сайта OSM, которые решат проблему.

Автором этого улучшения можно считать Энди Аллана, который работал над пул-реквестом с июля прошлого года. Но его история куда длиннее. Идея появилась в сентябре 2014 после очередной волны спама в дневничках. Том Хьюз тогда написал, что планирует добавить кнопку модерации к объектам сайта. Но ничего не произошло.

Далее, в 2015 году Shrey Bagroy предложил поработать на модерацией в рамках Google Summer of Code. Под руководством Серге Вроцлавского он программировал всё лето. Ветка была готова, но из-за каких-то разногласий Shrey не создал пул-реквест, ветка начала стареть, а студент, как водится, исчез сразу после получения денег.

Год спустя Гильем Ришар оформил ту ветку в пул-реквест. Оказалось, в ней немало проблем: непереводимые сообщения, странные костыли в модели данных, беспорядок в разграничении прав. Мэтт Эймос попробовал исправить самые явные проблемы, но сдался. По традиции, все выждали полгода перед комментированием и затем, в феврале 2017, посокрушались, что работы тут непочатый край. Наконец, в июле Энди взял работу Shrey с исправлениями Мэтта и каждый месяц что-то улучшал. Спустя год и более сотни коммитов, его пул-реквест приняли и выкатили на сайт.

Этот проект был в числе десяти важнейших задач, список которых в феврале этого года обновила рабочая группа по разработке. Теперь задач осталось девять. Среди них есть как технически простые, вроде списка комментариев к пакетам правок для пользователя, так и сложные, вроде типа area или наследника OWL. Если решитесь помочь сообществу, взявшись за одну из задач, то там же найдёте ссылки на работы на ту же тему и людей, к которым можно обратиться за помощью и руководством.

2018   osm.org
Ранее Ctrl + ↓