15 Anni di programmazione

Aneddoti e Codici di un inguaribile ottimista

Censimento Indiano, Unique Identifiers, Yahoo e GeoPlanet

 

Ho letto un articolo molto interessante sul censimento indiano che è partito in questi giorni. Lì troverete tutti i dettagli affascinanti di questo progetto visionario.

… il governo ha deciso di non limitarsi a contare la popolazione indiana, ma di assegnare a ogni singolo cittadino sopra i quindici anni un Unique Identity Number (UIN), un numero identificativo univoco”.

Immagino che gli amanti dei database avranno avuto un fremito ad apprendere questo dettaglio. Io ho subito associato la notizia alla meravigliosa serie TV degli anni 60 “The Prisoner” nella quale un ex-agente segreto del governo britannico, immediatamente dopo le sue dimissioni, viene imprigionato in un piccolo villaggio con abitazioni e monumenti in stile mediterraneo, situato in una località sconosciuta. Da quel momento tutti si rivolgono a lui chiamandolo Numero 6

 

 

C’è da chiedersi come potranno mai riuscire gli Indiani a realizzare questa impresa monumentale. Ebbene, il governo Indiano non ha badato a spese.

“…Per farlo ha reclutato alcuni dei migliori ingegneri e guru informatici indiani sparsi in giro per il mondo, tra cui il co-fondatore del servizio di foto online Snapfish e molti dipendenti di Google, Yahoo! e Intel. Il meccanismo è questo: per ogni cittadino si raccolgono non solo le classiche informazioni anagrafiche (nome, data di nascita, sesso, residenza, status familiare, occupazione), ma anche foto, impronte digitali e scansioni dell’iride. Tutte le informazioni sono poi archiviate in un enorme database centrale e lì associate a un numero identificativo di dodici cifre che viene poi spedito per posta. Passaporti, carte d’identità, patenti di guida, ration cards, tutto dovrà poi avere quelle dodici cifre stampate sopra o incorporate con un chip elettronico.”

Vedremo nei prossimi anni come andrà a finire questa storia. Intanto, il coinvolgimento di Yahoo! mi ha fatto ricordare un altro progetto dove si torna sul concetto di Unique Identifiers.

Yahoo! GeoPlanet™ Data

Yahoo! GeoPlanet helps bridge the gap between the real and virtual worlds by providing an open, permanent, and intelligent infrastructure for geo-referencing data on the Internet. This page provides open access to the underlying data under a Creative Commons Attribution license so that you can incorporate WOEIDs and the GeoPlanet hierarchy into your own application

In pratica, Yahoo! GeoPlanet è una risorsa che raccoglie tutte le località “geo-permanenti” sul pianeta Terra. Esso fornisce alla comunità di sviluppatori di software geografici un vocabolario e una grammatica per descrivere la geografia del mondo in maniera non equivoca, permanente e indipendente dai linguaggi. Le entità geografica fornite da Yahoo! GeoPlanet sono referenziate da un identifier a 32-bit: the Where On Earth ID (WOEID). I WOEID sono unici, non ripetitivi e, una volta assegnati, non vengono mai cambiati o riciclati. Può accadere che un WOEID venga deprecato e, in tal caso, viene mappato al suo successore o al suo WOEID parente.

Yahoo! GeoPlanet è un Web service REST, accessibile alla seguente URI:

http://where.yahooapis.com/v1[parameters]

Ci sono diversi progetti che utilizzano questo web service; un esempio è Twitter. Con un po’ di ricerche sul Web, troverete anche come legare in maniera semplice diversi servizi offerti dalla stessa Yahoo che utilizzano il WOEID.

Stabilito ciò, Yahoo! mette anche  a disposizione gratuitamente il database sotto forma di file testuali. 

I file sono i seguenti:

  1. geoplanet_places_[version].tsv: the WOEID, the placename, and the WOEID of its parent entity
  2. geoplanet_aliases_[version].tsv: alternate names in multiple languages indexed against the WOEID
  3. geoplanet_adjacencies_[version].tsv: the entities neighboring each WOEID
  4. geoplanet_changes_[version].tsv: the list of removed WOEIDs and their replacement WOEID mappings

Geoplanet_places è la tabella principale. Essa contiene i seguenti campi:

* WOE_ID - primary "place" key
* ISO - ISO 3166-1 country/territory code
* Name - preferred local language or english place name
* Language - ISO 639-2(b) language code
* PlaceType - code indicating place class
* Parent_ID - WOEID of direct parent feature

Ho importato i file sotto SQL Server 2008 e fatto qualche test. Per motivi di spazio, tornerò a parlare dei risultati ottenuti nel prossimo post.

Published 6 ott 2010 12:09 da Salvatore Sorrentino

Commenti

# Collegarsi a Flickr in applicazioni .NET e su WP7@ lunedì 22 agosto 2011 14.24

Gli Smartphone più comuni consentono di associare ad ogni foto le coordinate geografiche del punto in