96 заметок с тегом

источники

Maxar уходил, но вернулся, как обещал

Хорошая новость: спутниковые слои Maxar снова доступны! Мы прожили без них два месяца, не смогли подобрать URL тайлов взамен отключенных, но в опубликованном вчера обновлении редактора iD слои вернулись. К сожалению, JOSM и другие редакторы пока официально не поддерживаются, но расшифрованная ссылка уже проникла в список подложек JOSM.

Если вы не следили за новостями, Maxar — это новое название DigitalGlobe и новый набор слоёв, который прошлым летом окончательно заменил старые слои DG. Снимки DigitalGlobe нам выдали отчасти благодаря фейсбуку в 2017 году. Они всем нравились, потому что часто были самыми свежими. Снимки Maxar немного другие, что огорчило картографов в некоторых странах, но всё равно лучше прочих. Поэтому когда Кевин Баллок неожиданно объявил об их отключении, люди выражали своё расстройство целый месяц в полусотне комментариев.

Слои убрали не из-за осмеров. Ссылки на них были открыты, что было удобно и для добавления их в общий реестр подложек, и для изучения на сторонних веб-сайтах. Подключить снимки Maxar в свою веб-карту было не сильно сложнее, чем тайлы OpenStreetMap. Как и в «SAS.Планету», чтобы выкачать тайлы для любого региона в любых масштабах. Последнее и сломало Maxar: неизвестные люди или организации начали качать слишком много тайлов и слишком часто, что перегрузило серверы и, вероятно, стало слишком затратно для компании.

***

«Данные — новая нефть», и геоданные в особенности. Сотни тысяч компаний зарабатывают деньги исключительно обработкой данных, услугами на их основе. Вы знаете примеры. Но в отличие от нефти, которую нужно покупать у добывающих компаний, все привыкли к открытым данным, которые достаются бесплатно и почти без условий. «Информация должна быть бесплатной», популярно было говорить десять лет назад. Я в докладах порицал компании, торгующие картами, и призывал открывать геоданные и зарабатывать не на ресурсах, а на услугах. Потому что оплачивать нужно работу, а не доступ к вентилю.

Amazon как нельзя нагляднее показал, почему этот принцип не работает в мире Open Source. Люди пишут серверы и базы данных, публикуют код под открытой лицензией в соответствии со своими принципами и предлагают платные услуги по настройке и поддержке. И тут приходит Amazon, берёт бесплатное и предлагает те же услуги, но в единой инфраструктуре и дешевле, за счёт масштаба. Авторы в шоке от уходящих в амазон клиентов и начинают сомневаться, что сделали правильный выбор в пользу открытых исходников.

Мы это прочувствовали на себе в 2016 году, когда любители Pokemon Go сделали несколько сайтов, где можно было найти ближайших редких покемонов на карте. Тайлами для этих карт они выбрали бесплатные и открытые тайлы OpenStreetMap. От миллионов игроков наши серверы немного слегли и пришлось ввести драконовские ограничения на загрузку тайлов, от которых мы страдаем до сих пор. В прошлом же месяце нам удивили сотни людей, одновременно скачивающих файл планеты OSM. «Зачем вообще качать планету больше одного раза», — начали огрызаться участники.

Оказалось, что предоставление бесплатных ресурсов — это неблагодарная работа, требующая времени и денег, иногда слишком большого количества денег. Не говоря о получении этих данных — картографии или выведении спутников на орбиту и обработке снимков с них. Мы привыкли отдавать, а бизнес привык получать бесплатно. «Где получить снимки Земли в качестве не хуже Google Maps для коммерческой деятельности, желательно бесплатные?» — спросили в чатике недавно. Смешно звучит, но ведь «информация должна быть свободной», что тут такого? Очередной виток трагедии общин, разворачивающийся уже второй год, грозит сломать нам open source, сломать публикацию данных и усложнить жизнь картографам в OpenStreetMap.

Попытка Maxar закрыть тайловый слой для всех, кроме осмеров, первая в истории. Вместо записи в реестре подложек, его добавили напрямую в редактор iD с помощью Брайана и Квинси.. Ссылка защищена шифрованием AES: вместо домена и пути — набор цифр. Так просто адреса тайлов не вытащишь — нужно собирать по исходникам ключи, проверять алгоритм, писать код. Или... открыть инспектор сети в браузере и увидеть там готовые ссылки с ключами. Что и сделал вчера некто Sosha, чтобы обновить ссылки в JOSM. Ничто не помешает нажать те же кнопки сотрудникам компаний, которые хотят бесплатных снимков, и всё начнётся по-новой.

 1 комментарий   4 мес   источники

Slide!

Нам снова разрешили использовать тепловую карту точек Strava для улучшения карты. Участник PangoSE из Швеции воспользовался лучшим способом для открытия данных с непонятным статусом: написал письмо с вопросом. И старший менеджер продукта Strava Metro ответил: мол, да, не видим в этом ничего плохого. Но есть ощущение, что и разрешение не то, и данные как-то уже не нужны.

Strava — это соцсеточка для фитнеса: выдаёт задания и отслеживает маршруты и показатели, позволяя хвастаться ими нажатием кнопки. С 2014 года часть карт на их сайте и в мобильных приложениях перешли на OSM. В то время в компании работал Пол Мак, автор многих гео-библиотек на Go, велосипедист и осмер. На SotM US в Вашингтоне он показал Strava Slide: форк редактора iD, который добавлял подложкой тепловую карту точек из велосипедных треков Strava и позволял одной кнопкой оформлять их в дороги для OpenStreetMap. Через пару дней Пол твитом разрешил рисовать карту по этому слою. Подложку добавили в JOSM и iD и начали по ней уточнять велодорожки и тропы в лесах.

После того, как в январе 2018 года студент австралийского университета нашёл на их карте маршруты пробежек вокруг военных баз по всему миру, Strava начала закручивать гайки. Помимо прочего, тепловая карта потеряла в детальности: огромные квадратики уже не помогали в уточнении OSM. Редактор Slide перестал работать, его подложка расплылась. Картографы не хотели терять такой источник информации: в отличие от осма с его двумястами треками в день, на карту Strava загружают двести тысяч велопоездок в день. Поэтому мы писали в компанию — но безответно. Неразмытые тепловые карты убрали из публичного доступа, пусть их и можно было достать, подставив регистрационные токены. Но молчание вкупе с закрытием означало, что разрешения на обводку в OpenStreetMap у нас нет. Если книгу, которую раньше можно было взять в библиотеке, спрятали на заднем дворе под замком, то наличие отмычки не даёт права её копировать.

16 ноября пятилетнее молчание прервалось: Родриго ответил, что они там все очень любят OSM. Сквозь телеграм-чатики, вики и почтовые рассылки пронеслось радостное письмо PangoSE, вики недвусмысленно говорит: «OpenStreetMap users have permission to use the data». Русскую вики-страницу летом полностью переписал участник PG7: на ней не только красочная история взаимодействия сообщества и компании, но и перечисление способов, как детальную тепловую карту подключить в JOSM и iD. Последние методы сводятся к подключению прокси-подложек с сервера Макса Кожина, про которые тот рассказал на хабре.

Проблема очевидна: разрешение-то где? Слова «мы не против» — лишь слова, пока не подкреплены делом. У нас нет однозначного «да, мы разрешаем». И у нас нет способа получить эти тайлы, не взламывая систему доступа и не нарушая условия использования, которые всё так же не упоминают OSM. Продолжая метафору выше, старший библиотекарь не против, что вы взломаете дверь, за которой книга, но само действие всё ещё противоправно. Об этом легко забыть, читая статью в нашей вики, написанную с позиции «что не запрещено — разрешено». Но по части лицензий многие осмеры стараются блюсти осторожность, запрещая использование источников с сомнительными условиями, типа русской кадастровой карты или панорам гугля. Другие картографы, вкусившие картографической свободы, бесятся от таких нелогичных на первый взгляд ограничений. Принцип «Нет значит нет» принимают не во всех культурах, и в России особенно. Что уж говорить про «отсутствие „да“ тоже значит нет».

Если в ближайшие месяцы (или годы, учитывая скорость реакции) обе проблемы решат, то у нас появится легальная подложка велотреков Strava. И возникнет следующий вопрос: а зачем? Ну, то есть, интересно посмотреть, где катаются велосипедисты, какие маршруты чаще выбирают. Но вы посмотрите на окрестности городов: за эти пять лет велосипедисты уже отметили всё что только можно. Они теперь планируют маршрут по карте OpenStreetMap, а не карта OSM рисуется по маршрутам их покатушек. Найти важную неотмеченную велодорожку, пользуясь тепловой картой, о-очень нетривиально. Это как искать пропущенную улицу в Нью-Йорке, пользуясь треками машин Juno. Она там есть, но спрятана среди десяти тысяч других улиц.

Чтобы тепловая карта Strava приносила пользу, а не лежала, спрятанная в подпапке «другое» меню слоёв JOSM, нужна автоматизация. Да, OpenStreetMap уже на том этапе развития, когда обклацывать подложки руками почти так же лениво, как обрабатывать обходные листы с прогулок. Есть же умный компьютер с нейросеточками — пусть он и работает. Дороги на снимках ищет фейсбуковский RapiD, пропущенные дороги и запреты поворотов отслеживают валидаторы. Пользу от стравовских треков принесёт только векторизатор в паре со сравнивалкой с OpenStreetMap. Или, хотя бы, достаточно мощный API, чтобы подобные инструменты мог написать кто-то другой. Но в свете продолжающегося закручивания гаек во второй половине этого года, оба исхода одинаково маловероятны.

Шесть-восемь лет мы радовались каждому источнику. Считали области, покрытые кадастровой картой. Внимательно следили за картой покрытия детальными снимками Bing и праздновали соглашение между Mapbox и DigitalGlobe. Источников было мало, а карту хотелось рисовать в каждом посёлке, поэтому мы хотели больше. Спутниковые слои были будущим OpenStreetMap. Новый слой значил новые покрытые города, что означало, что наши данные в этих городах смогут состязаться с народной картой, чьи картографы нежились на горах яндексовских снимков.

Теперь же нам, в общем, пофиг. Открыл редактор — выбирай из шести спутниковых слоёв со всемирным покрытием и ещё из нескольких региональных. Есть слой треков, есть Mapillary и OpenStreetCam, есть OpenAerialMap. Источников гора — а обрисовывают всё равно только Bing, который редактор iD показывает по умолчанию. Нам нечего желать: от «что бы обрисовать» мы дошли до «кто бы отрисовал». Мы очень остро почувствовали нехватку участников в OSM, и справляемся с ней по-разному. Кто-то ушёл в отрицание: мол, опытный участник лучше дюжины новичков, и уж точно лучше автоматики. Гуманитарная команда и другие организации собирают залы проектами навроде Missing Maps. Потом считают, сколько процентов пришли во второй раз (очень мало). Третьи поворачиваются к открытым данным.

Открытые данные и есть источник будущего для OpenStreetMap. Их не нужно обклацывать, разве что быстренько прощёлкать для проверки (сейчас как раз смотрят на театры в России). Данных много: одних только адресов проект OpenAddresses собрал полмиллиарда. Они не сильно конкурируют с обычными картографами: десять человек могут обклацать снимки целого региона, а вот объехать и собрать информацию о всех заправках или гипермаркетах будет сложнее. Сюда же можно добавить сотни миллионов распознанных нейросеточками домов. И, конечно, дороги и «зелёнка», время от времени появляющиеся в разных странах Европы и Северной Америки. Использование не подложек, но данных со стороны, — это и есть неминуемое будущее создания открытой карты. Поздно ругаться: почти все крупные компании, подсевшие на OSM, делают импорты разных видов, и пора перестать делать вид, что их нет.

Именно этого я бы ждал от Strava, если их гео-команда действительно заинтересована в улучшении OpenStreetMap. Не растрового слоя, а данных. Проект Strava Metro уже векторизует линии поездок для оценки и планирования транспортных сетей. Дело за малым: посмотреть, как эти транспортные сети обозначаются в OSM, совместить данные, найти промежутки, которые стоит заполнить. А дальше уже получить пользу от совмещения данных: например, используя данные о городах и туристической инфраструктуре, одной кнопкой строить потенциальные коридоры для региональных веломаршрутов. Главное — понимать, чем OpenStreetMap может помочь бизнесу, и принять его особенности. Из этого может родиться взаимополезный обмен данными. А без понимания мы имеем только скрытый слой разноцветных точек и редкие невнятные реплики от компании.

 1 комментарий   7 мес   источники

Что за Maxar?

Три недели назад вы могли заметить новый слой спутниковых снимков в вашем редакторе: DigitalGlobe Vivid. А неделю назад — что его заменили два других, тоже на весь мир: Maxar Standard и Maxar Premium. Откуда они и зачем?

Быстрое гугление показывает, что Maxar Technologies получилась в октябре 2017 года слиянием MDA Holdings и DigitalGlobe. Объединённая компания занимается всем, что связано с космосом и спутниками. Теперь ещё и продажей космоснимков. Все сотрудники перешли в Maxar, и они не собираются отзывать разрешение на обрисовку снимков у OpenStreetMap. Никто не делал заявлений на этот счёт, но пул-реквесты в каталог подложек показывают, что в Maxar помнят про сотрудничество и обновляют ссылки.

Новые слои отличаются от старых. Технически — тем, что они не проходят через серверы Mapbox, а отдаются напрямую с DG. Содержанием тоже. В описании Maxar Premium упоминается, что это то же, что DG +Vivid, который нам два года назад выдали в слое DG Premium. Сравнение снимков в десяти городах показало, что чаще всего оба новых слоя совпадают, а если нет, то свежее может быть как Standard (в Новосибирске), так и Premium (в Калининграде). Но в паре мест — в районах Москвы, Петербурга и Саранска — самым свежим оказался DG Premium.

Это печально, потому что старые слои DigitalGlobe отключат не позднее 30 июня. Мы потеряем как самые свежие снимки, по которым можно нарисовать стадион в Саранске, так и самые старые, которые напомнят, как выглядели города до строительного бума. Представители Maxar пока не отвечают на вопросы, но на всякий случай, не откладывайте рисование новых жилых комплексов и инфраструктуры. Конечно, через год-два они появятся на всех слоях, но у нас же самая актуальная и точная карта сегодня, а не через год.

 1 комментарий   2019   источники

Агентам справочника вход воспрещён

Анна из «народной карты» расписала в их блоге, откуда берутся заведения на картах яндекса. В компании ведут два набора данных: «справочник» и «народная карта». Копирование данных налажено пока только из карты, скоро будет и обратное. И этот поток автоматических правок будет куда сильнее: ведь доля пользовательских данных в наполнении справочника очень мала.

Здесь всплывают две темы: постепенное замещение картографов-любителей роботами на «народных картах» под безграничное терпение первых и приоритеты в картографировании заведений. Обе темы подчёркивают радикальное отличие и «народных карт», и просто карт Яндекса от OpenStreetMap во всех своих ипостасях.

Приоритеты

В заметке перечислены восемь источников данных о заведениях, которые склеиваются и доступны из поиска на карте: правки народных картографов, сообщения из разных видов обратной связи, информация от организаций и от оплачиваемых сборщиков данных. Сколько из них есть в OSM? Только два: правки осмеров и заметки на сайте. Хотя, честно говоря, заметками владельцы заведений не пользуются, потому что их почти невозможно найти.

Где всё остальное? Ладно, у нас нет службы поддержки и сотрудников, обзванивающих организации. Но многие компании специально платят, чтобы их филиалы наносили на карты — и мы осознанно сопротивляемся этим «импортам». Что хорошо для всех популярных карт, оказывается плохо для OpenStreetMap. Как же так?

Дело в целевой аудитории. Кто адресат нашей карты, для кого мы рисуем? На сайте и в вики про это ни слова. «OSM предоставляет данные тысячам сайтов» — ничего не значащее утверждение, этот блог тоже предоставляет. А если OSMF и администраторы сайта отказываются ограничить ЦА карты, за них это сделают сами картографы. Самым очевидным способом.

OpenStreetMap — это карта для картографов под открытой лицензией. Два тезиса, которые определяют все решения в проекте. Открытая лицензия регулирует отношения со внешним миром: запрет на нелегальные данные и обклацывание гугля, публикацию планеты под ODbL, экосистему открытого кода. А первый тезис, что целевая аудитория — это картографы, регулирует все вопросы внутри сообщества. Прежде всего, конечно, тегирование, требования к редакторам и выбор допустимых слоёв для импортирования.

Самое неочевидное, что следует из ориентированности на редакторов карты, — это ограничение на размер данных. Когда их становится слишком много (например, после массового импорта «зелёнки»), сообщество бунтует и заводит reverter. OSM состоит из одного слоя, который непросто разделить по типам объектов, поэтому один перегруженный слой затрудняет редактирование остальных. Нарисовали схему помещений — контур здания теперь не улучшить. Импортировали Corine — проще закрыть редактор, чем обозначить вырубку. Обозначили каждый лоток на рынке — никто не будет обновлять информацию, да и проходы трогать побоятся.

Поэтому участники неодобрительно смотрят на импорты заведений. С одной стороны, пользователям карты хорошо: можно найти в любимом Maps.Me или OsmAnd заправку по пути и кафе у гостиницы. С другой, мы рисуем OSM не для пользователей: сотни тысяч, если не миллионы, импортируемых точек нужно проверять, поддерживать, обновлять. Никто этим не будет заниматься, а потому они не должны быть частью карты. Карта — для того, что интересно рисовать и несложно поддерживать.

Роботы

Задачу поддержки заведений из сторонних источников решить несложно: периодически проверять и импортировать заново. От картографов ничего не понадобится, только верить и не мешать. Разумеется, правки импортированных данных сохранятся после обновления — или нет, смотря сколько времени прошло. В перспективе это можно распространить на «зелёнку» и адреса.

Получится, что за существенную часть данных OpenStreetMap — сотни миллионов объектов — будут отвечать роботы, пусть и курируемые людьми. Медленно процесс поддержки данных OSM будет мигрировать к модели википедии, когда в истории правок любой статьи минимум 10% правок идут от роботов, следящих за порядком. Потому что если можно импортировать, то почему нельзя автоматически amenity=sauna заменять на leisure=sauna? Логично же это поручить роботу и спать спокойно, зная, что база консистентна?

В народных картах Яндекса это само собой разумеется. Там автоматизировано всё: импортирование данных в новых странах, сдвиг объектов при обновлении снимков, обновление данных из справочника. Роботам помогают сотрудники на зарплате и участники «Толоки», которых всё больше. Когда нужна актуальная и полная карта, полагаться на добровольных картографов-любителей недостаточно — это очевидно примерно всем. Поэтому народная карта мигрирует влево по шкале свободы картографии, усиливая контроль над содержимым карты.

Активным участникам сообщества НЯК это, конечно, не нравится. Данные от людей на зарплате предсказуемо хуже работы любителей — по всем показателям, кроме тех, что входят в ТЗ. «Теперь я не слежу за порядком. Спасибо яндексу за это», — хлопают дверью модераторы. Да и под заметкой про интеграцию справочника немало недоумённых комментариев. Это всё люди, которые не успели перестроиться три года назад и не поняли, что «народная карта» больше не самостоятельная песочница, где можно в одиночку нарисовать и поддерживать город, а инструмент обратной связи к картам Яндекса. Народные картографы теперь не столько правят карту, сколько корректируют импортированное и нарисованное профессионалами.

Очевидно, что автоматические правки противоречат целям сообщества OpenStreetMap: иметь карту, которую весело редактировать. Картограф с опытом всегда найдёт, какую претензию предъявить оператору любого скрипта. Данные плохо привязаны. Теги неправильные, но замена неравнозначна. Формат телефонного номера не тот. Это дискриминация против малого бизнеса. Хорошо, но проверяй каждый объект вручную. Этим атрибутам не место в OSM. Посмотрите на TIGER, хотите повторения? Любой импорт или автоматическая правка должны пройти через болото уныния, и редкий энтузиаст доползёт до его середины.

Мы говорим «карту может поправить каждый», но мы же и говорим «карта для любителей, а не корпораций». Мы ратуем за карту без дискриминации, но в то же время рисуем таблички про вход воспрещён. Открытый проект, но пожалуйста, не надо. Решить это противоречие может сильная структура, наделённая правом окончательного голоса. Но в нынешней парадигме «Совет + рабочие группы» такая структура невозможна. Тут либо делать альтернативный проект, либо повторить то, что Стив Кост сделал четырнадцать лет назад: выкручиваться малыми силами, находя новые смыслы в существующих структурах. И не сказать, что это невозможно. Продолжение.

 2 комментария   2018   ВНЕЗАПНО   источники   няк

Знаки

Вчера на форуме в очередной раз высказали мнение, что будущее открытой картографии — за автоматическим распознаванием. Несколько компаний исследуют это направление уже много лет. Самая заметная из них — Mapillary, «народные панорамы». Дождавшись, когда база фотографий подрастёт до сотен миллионов, они начали выяснять, что же на них запечатлено. В январе 2015 года Mapillary показали слой с дорожными знаками и спустя несколько месяцев добавили его в JOSM и iD.

Две недели назад они анонсировали большое обновление набора дорожных знаков. За это время от машинного зрения они перешли к машинному обучению, прокатали через него на порядок больше снимков, а в октябре ещё и запустили «игру», в которой человеку нужно оценить точность распознавания.

Telenav с их конкурирующим проектом OpenStreetCam занимается примерно тем же — но с конкретной целью улучшить OSM, а не только собрать базу «на всякий случай». Филипп Кэндал, руководитель разработки, рассказал в 2016 году, что его команда пишет распознавалку знаков и указателей и уже уточнила двадцать тысяч ограничений на карте. За автоматикой, по его словам, будущее.

Для картографов OSM знаки в плагинах Telenav появились только в феврале этого года: всего полмиллиона и лишь в США и Канаде. Зато они сравнивают распознанные ограничения с данными OpenStreetMap, и картографов можно оповестить о необходимости уточнить карту. В апреле эту функциональность добавили в модуль для JOSM.

Наконец, в мае Telenav снова признался в верности открытому сообществу, опубликовав весь код распознавания знаков и натренированную модель под открытой лицензией Mozilla. Саму базу знаков тоже скоро откроют. Мартайн предлагает задействовать эту нейросеточку для распознавания новых типов объектов: скамеек, фонарных столбов, остановок. Чтобы это открытие не прошло незамеченным, Telenav объявил конкурс: сделайте свой проект до 17 августа и выиграйте 10 тысяч долларов — если он распознает более 94% объектов. Условия расплывчаты — вероятно, более опытные участники таких конкурсов поймут, что к чему.

А что Mapbox? Странным образом, они тоже участвуют в этом ажиотаже — но до недавнего времени только командой картографии. В 2016 году они собрали интерактивную карту, сопоставляющую знаки от Mapillary и данные OSM (что Telenav, напомним, делает автоматически) и улучшали нашу карту — только в США, конечно. 13 июня этой карте пришёл конец, хотя все исходники доступны на github. А на следующий день Вирджиния из команды машинного обучения Mapbox раскрыла, что они взяли у Bing снимки StreetSide на 23 американских города, прогнали их через нейросеточки и получили новую интерактивную карту со 184 тысячами распознанных ограничений движения. Их команда картографов медленно продирается через этот набор данных, но от помощи они не откажутся.

Все эти компании распознают знаки на фотографиях, но автоматизируют только это — и, иногда, сопоставление с ограничениями в OpenStreetMap. А внесение в базу геоданных — ни-ни. Отчасти потому, что знаки не соответствуют никаким объектам на карте, они лишь задают свойства для уже существующих дорог. Причём не всегда привязанные к координатам знаков. Сопоставлять знаки и карту непросто, тем более, если с целью карту улучшить.

Другая причина — сообщество OSM не разделяет мнение Филиппа, что автоматическое распознавание — будущее картографии. Лучше в сто раз медленнее, но руками, с тёплыми ламповыми ошибками и чувством удовлетворения от работы, неведомым алгоритму. Фейсбук уже несколько лет пытается переломить это заблуждение — на конференции SotM в Милане через месяц они снова расскажут, как взаимодействуют с сообществом в Таиланде, куда импортируют распознанные нейросетями дороги.

 1 комментарий   2018   источники   панорамы
Ранее Ctrl + ↓

Мнения, высказанные на этом сайте, отражают точку зрения лично автора сайта и ничью больше: ни его бывших или настоящих работодателей, ни семьи и знакомых.