Dotazy a data

Základním parametrem geokodování je parametr query, tedy vyhledávaný textový dotaz. Tento text je analyzován a porovnáván s rozsáhlou databází geografických a místopisných údajů. Dotaz může být ve formě názvu místa, adresy, názvu bodu zájmu (POI), nebo zeměpisných souřadnic v textovém formátu.

Parametr type

Pro určení, jaký typ dat má být vyhledáván, se používá parametr type. Tento parametr rozlišuje mezi třemi základními kategoriemi (a je možné je kombinovat, či vybírat podkategorie):

  1. regional: Tato kategorie (plus podkategorie) se zaměřuje na vyhledávání v regionální struktuře. Patří sem dotazy na adresy, ulice, města, regiony a státy.
  2. poi: Když je parametr type nastaven na poi, vyhledávání se zaměřuje na body zájmu (Points of Interest). Do této kategorie spadají dotazy např. na názvy restaurací, hotelů, zastávek, rozhleden, hradů a jiných míst.
  3. coordinate: Tento typ slouží k převodu textově zadaných zeměpisných souřadnic na konkrétní místo na mapě. Dokáže zpracovat souřadnice v různých formátech.

Chytré vyhledávání

Funkce Geokódování a Našeptávání prohledávají data pomocí chytrých (a neustále rozvíjených) algoritmů. Nejde pouze o přesnou shodu textu dotazu s databází, ale funkce pracuje i s různými tvary slov, variantami jazyka, a dokonce dokáže korigovat běžné překlepy. Tato „magie“ za vyhledáváním umožňuje uživatelům najít požadované místo i při zadání neúplného nebo nepřesného dotazu. Systém využívá sofistikované algoritmy, které zohledňují synonymy, regionální názvy a běžné chyby při psaní.S čím si např. dokáže vyhledávání poradit:

Různé formy zadání 

  • Dlouhá 21, Praha 1
  • Dlouhá 737, Praha 1
  • Dlouhá 737/21, Praha
  • Dlouhá 21, 110 00
  • Dlouhá 21,  Staré město

Různé pořadí

  • Dlouhá 21, Praha 1
  • Praha 1, Dlouhá 21
  • 11000,Dlouhá 21
  • ..

Různé vstupní jazyky

  • Václavské náměstí 1, Praha 1
  • Wenceslas Square 846/1
  • Wenzelsplatz 1, prager neustadt

Místní názvy

  • Václavák 846/1

Překlepy, diakritika (jen suggest, strojově učený model)

  • dloha 21 pracha 1
  • vaclafske namsti 1

Vyhledávání podle GPS souřadnic

Při použití type=coordinate umí geokódování rozeznávat i různé formáty GPS souřadnic. Zde jsou příklady (nikoliv kompletní výčet). Na rozpoznávání má vliv i nastavení jazyka.

WGS-84

  • 50.6795675N; 14.8752756E
  • „50° 41′ 47.52″ N, 15° 6′ 18.57″ E“
  • 0°41’47.638″N, 15°44’18.348″E
  • 49°10′ 47.69″N, 16°29’40.01″E
  • 49°26’7.109″N,13°28’58.555″E
  • 49°50’37.604″N,15°57’29.891″E
  • 49°18’24.387″N,16°40’40.949″E
  • 50.088153,14.40094
  • 50.55533 15.12943
  • N50 4.315, E14 24.181
  • N 49° 32.797 E 017° 42.614
  • 33U E 509168 N 5600386
  • UTM: 33U E 509168 N 5600386
  • N 49° 21´ 04.144´´ E 15° 38´ 57.300´´
  • N 50° 33′ 19.188″ E 15° 7′ 45.948
  • N 50° 33.320 E 015° 07.766
  • 40 s.š., 47 v.d.
  • 40 N, 47 E
  • 40 S, 47 V

OLC

  • 9F2P3CC2+C83

S-JTSK (Systém jednotné trigonometrické sítě katastrální, na území ČR)

  • jtsk: 801310.09, 1077249.26
  • -801310.09, -1077249.26
  • Y: 801310.09, X: 1077249.26
  • Y: 801310,09, X: 1077249,26

Podrobná data

Jakkoliv chytré hledání nenajde nic, pokud nehledá v podrobné databázi. S jakými daty naše hledání pracuje:

Adresní body

CZ

  • Primárním zdrojem je pravidelně importovaný RUIAN
  • Redakce občas přidává adresy “na míru” (pokud v RUIAN zatím chybějí, nebo se jedná o místní používané “neoficiální” označení)

Zbytek světa

  • Základ tvoří data z OpenStreetMap
  • V jednotlivých státech postupně doplňujeme o místní registry
    • Máme Slovensko, Rakousko, Polsko, Švýcarsko, Belgie, Lucembursko, Slovinsko, Estonsko
    • Připravujeme Nizozemí, Finsko, Dánsko, Norsko, atd.

Regionální data udržujeme jak v nativním jazyce, tak dohledáváme překlady do dalších jazyků a různé alternativní názvy.

ZIP kódy (PSČ)

  • CZ, SK, Germany, Poland, Austria, Hungary, Italy, France, United Kingdom
  • Chystáme zbytek západní Evropy