İnternetin Açık Kaynak Veri Tabanları

İnternetteki veri akışı kullanılarak dünyanın iklim değişiklikleri, toplumsal hareketleri ve ekonomisi, finansal pazar verileri, sağlık kayıtları ve sosyal ağlardan elde edilen bilgileri semantik bir mantıkla derleyip, tahminler veya simülasyon yapmak teorik olarak mümkün. Bunun için ilk yapılması gereken online veri tabanlarına ulaşmaktır.

Bu yazı ilk olarak 2011 tarihinde M. Mekin PESEN tarafından www.e-siber.com adresinde yazılmıştır. Domain adresi değişikliği nedeniyle yazı 22 Ekim 2017 tarihinde eSiber.com'a taşınmış ve sonrasında Sibergah.com adresine aktarılmıştır. Bu yazı izinsiz olarak hiçbir şekilde başka bir yerde kullanılamaz.

İnternetteki açık kaynak veri tabanları ile edilen verileri semantik teknolojiler yoluyla derleyerek muazzam bir canlı dünya simülasyonu elde edilebilir. 2010 Nisan ayında Avrupa Komisyonunda dünyadaki her türlü krizi, toplumsal sorun ve değişimleri ve sosyal patlamaları önceden tahmin edebilmeyi mümkün kılacak bir proje başlatılması konusu gündeme gelmişti. Tabii böyle bir canlı dünya simülasyonu elde edebilmek için çok iyi bilgisayarlar, sağlam bir algoritma modeli, iyi bir mühendislik desteği ve de tüm veri akışlarının yapıldığı veri tabanlarına tam erişim sağlamak gerekir. Bu projenin gerçekleşmesinin önünde boğuşması gereken elbette bir yığın problem vardı. Muhtemelen böyle bir projeyi hayata geçirenler elde ettikleri hazineyi hiçbir şekilde başkalarıyla da paylaşmayacaklardır. Çünkü bunun inanılmaz bir avantaj sağlaması ve maddi getiri potansiyeli onu her türlü rakipten sakındırılması gereken bir proje haline getirecektir. Projenin kendisi bir yana, veri kaynakları olarak kullanılması düşünüle veri tabanları gerçekten çok ilginç ve faydalı sitelerden oluşuyor. Sizler için bu veri tabanlarını bir araya getirdik:

İnternet ve Tarihsel Enstantaneler

  • Internet Archive / Wayback machine
    İnternet arşivi ve geri dönüş makinesi araştırmacılar, tarihçiler ve öğrenciler için dijital ortamda yazı, ses, resim ve program arşivi sunmakta olan ve 1996’dan bu yana bu işi yapan kaynak bir sitedir.
  • Wikipedia
    Wikipedia, hepimizin çok aşina olduğu gibi internetin elle müdahaleye de izin veren en geniş kütüphanesidir. Dışarıdan müdahaleye çok açık olduğundan dolayı içindeki bazı bilgileri ve verileri sıkı bir kontrolden geçirmekte her zaman fayda var.
  • World Digital Library
    Dijital dünya kütüphanesidir. Dünya üzerinde kültürler ve toplumlar hakkında bilgiler sağlayan çok yararlı bir kaynaktır.
  • Freebase
    12 milyondan fazla kategorik olarak düzenlenmiş verinin sunulduğu muazzam bir depodur. Aklınıza gelebilecek her türlü konuda birleştirilmiş, aralarında bağlamsal ilişkiler bulunanlar sunan milyonlarca bilginin olduğu açık kaynak bir veri tabanıdır. Sadece 2007-2015 dönemini kapsıyor, artık güncellenmiyor.
  • Google Trends
    Google’da zamanla aranan anahtar kelimelerin görsel istatistiklerini ve karşılaştırmalarını sunan bir trend analizi aracıdır.

Krizler, Çatışma ve Savaş Verileri

  • PRIO
    1946’dan günümüze dünya üzerinde yaşanmış tüm silahlı çatışmalar ve savaşların verilerinin tutulduğu bir veri tabanıdır. 
  • WarViews
    Çatışmaları ve savaşları coğrafi bilgi sistemi kullanarak gösteren bir projedir.
  • Uppsala Conflict Data Program (UCDP).
  • ACLED
    Silahlı çatışmaların konum ve olay veri setlerini sunan, ülke ülke kodlama yapılan ve 1997’den 2016’ya kadarki olayları sunan bir veri tabanıdır.
  • CERAC
    Çatışma, çarpışma ve savaş analizi kaynağıdır. Politik ve siyasi veriler de sunuyor.
  • The Cross-National Time-Series Data Archive
    1815’ten günümüze çok geniş bir alanda yaşanmış olayların sunulduğu oldukça muazzam bir veri tabanıdır.

Ekonomik ve Finansal Veriler

  • Maddison Historical Statistics
    Ekonomik büyüme, gelişme, kalkınma ve nüfus verilerini tarihsel istatistiklere bağlı olarak gösteren yararlı bir kaynak.
  • The UNCTAD Statistics and data
    Birleşmiş Milletler’in ticaret ve kalkınma üzerine 1950’den bu yana tuttuğu verilerin bulunduğu bir kaynaktır.
  • OECD Data Explorer
    OECD ülkeleri hakkında ekonomik ve demografik istatistiklerin sunulduğu faydalı bir portal.
  • EUROSTAT
    Avrupa Birliği ülkeleri ve aday ülkeler hakkında çok çeşitli istatistiklerin sunulduğu güzel bir kaynak.
  • Eurobilltracker
    Euro takip sitesi.

Sosyal Bilimler

  • ICPSR of the University of Michigan
    Bütün disiplinlerde 500,000’den fazla dijital dosyayı bünyesinde barından oldukça harika bir araştırma sitesidir. 
  • UK Data Center of the University of Essex
    İngiltere’nin en büyük sosyal ve beşeri bilimler veri tabanıdır.
  • Berkeley’s UC D-Lab
    Politik, sosyal ve sağlık alanındaki bilimlere ait verilerin tutulduğu Berkeley Üniversitesinin veri deposudur.
  • CESSDA Data Catalogue
    CESSDA Veri Kataloğu, Servis Sağlayıcılarımız tarafından tutulan on binlerce Avrupa araştırmasını ve veri koleksiyonunu içermektedir.
  • Gapminder Data
    Birçok konudaki istatistikleri ve verileri incelenebilir hale getirip genel kullanıma sunan popüler bir uygulamadır. Tonlarca veri kümesi ve sosyo-ekonomik bilgiyi ücretsiz sunuyor.
  • World Value Survey
    Dünya değerleri anketi de diyebileceğimi site dünya üzerindeki kültürler, değerler ve değişimlerin verilerini ve bu konudaki anket çalışmalarını sunan çok yararlı bir kaynaktır.

Sağlık ve Hastalık Verileri

Diğer Açık Veri Teşebbüsleri

  • Data.gov
    Araştırmacılar için oldukça geniş bir alanda Amerika’a ait açık veriler sunan bir portaldir.
  • Data.gov.uk
    Araştırmacılar için oldukça geniş bir alanda İngiltere’ye ait açık veriler sunan bir portaldir.
  • Data Commons
    Google’ın dünyadaki sosyo-ekonomik göstergelere ve sağlayacılara bağlı olarak elde ettiği açık verileri görsel hale getirdiği çok yararlı bir sitedir.
  • Common Crawl
    2010 yılından bu yana 40’tan fazla dilde yazılmış milyarlarca web sayfası ile trilyonlarca bağlantının ham, metadata ve metin verisi olarak ücretsiz bir şekilde sunulduğu muazzam bir veri tabanıdır.

Bir Cevap Yazın

Bu site istenmeyenleri azaltmak için Akismet kullanır. Yorum verilerinizin nasıl işlendiğini öğrenin.