Selasa, 15 Februari 2011

Membangun Web Semantic Pragmatis

Suatu web semantik biasanya merujuk kepada kemampuan aplikasi komputer untuk lebih memahami bahasa manusia, bukan hanya bahasa yang baku dari para penggunanya tetapi juga bahasa yang lebih kompleks, seperti dalam bahasa percakapan sehingga memudahkan penggunanya untuk berkomunikasi dengan mesin. Web semantik dapat mengolah bahasa dan mengenali homonim, sinonim, atau atribut yang berbeda pada suatu database.

Istilah web semantik itu sendiri diperkenalkan oleh Tim Berners-Lee, penemu World Wide Web. Sekarang, prinsip web semantik disebut-sebut akan muncul pada Web 3.0, generasi ketiga dari World Wide Web. Bahkan Web 3.0 itu sendiri sering disamakan dengan web semantik. Web semantik menggunakan XML, XMLS (XML Schema), RDF, RDFS (Resources Description Framework Schema) dan OWL. Sedangkan Pragmatika adalah cabang ilmu linguistik yang mempelajari hubungan antara konteks dan makna. Ilmu ini mempelajari bagaimana penyampaian makna tidak hanya bergantung pada pengetahuan linguistik (tata bahasa, leksikon, dll) dari pembicara dan pendengar, tapi juga dari konteks penuturan, pengetahuan tentang status para pihak yang terlibat dalam pembicaraan, maksud tersirat dari pembicara, dll.

Dan berikut ini adalah beberapa cara untuk membangun web semantik pragmatis yaitu :

1. Menarik organisasi ke SW (Semantic Web)
Memperkenalkan satu teknologi baru seperti SW ke organisasi yang manapun harus diatur dengan cermat sehingga ketika ke gangguan minimise ke pada saat prosedur  pekerjaan dan data/informasi berjalan, dan untuk memperoleh kepercayaan dan daya tarik mereka di dalam teknologi baru. Ini penting untuk mengikuti satu realistis, pendekatan praktis dan murah.

a.  meminimalkan ganguan untuk keberadaan infrastruktur
Hal ini penting untuk menunjukkan bahwa mengadopsi teknologi SW tidak berarti membuang yang sudah ada database dan teknologi informasi, rekayasa ulang pengolahan informasi tugas yang ompleks dan sulit difasilitasi oleh kondisi khusus dan struktur yang tidak memperoleh di semua negara dan budaya. Sebuah bagian penting dari tugas kita adalah untuk menunjukkan bahwa adopsi SW biaya relatif rendah. Kami menunjukkan bagaimana script sederhana bisa digunakan untuk mengkonversi data ke dalam tiga kali lipat RDF dengan interpretasi diperkaya. Pendekatan kami diadopsi adalah untuk cache database yang diberikan ke toko tiga. Pendekatan alternatif lain adalah dengan menggunakan teknologi seperti D2RQ3 yang memungkinkan layering ontologi di atas non- RDF database, sehingga menghilangkan kebutuhan untuk cache atau mengubah struktur asli
database.

b. Minimalkan komitmen ontologis Anda
Minimalkan komitmen ontologis Anda Ontologi bervariasi menurut tingkat formalisasi, tujuan yang mereka dibangun, dan subyek yang mereka wakili. Salah satu langkah pertama yang direkomendasikan untuk membangun ontologi adalah untuk ruang lingkup domain untuk membuat ontologi yakin tidak tumbuh terlalu besar untuk apa yang dibutuhkan [11]. Ukuran yang sesuai untuk suatu ontologi tergantung pada tujuan dan domain yang diwakilinya. Beberapa ontologi dirancang untuk mewakili seluruh domain, seperti Gene Ontology (GO) 4, dan mendasar Model Anatomi (FMA) ontology5, dan dengan demikian cenderung menjadi ukuran sangat besar. Ontologi juga dapat dibangun untuk melayani kebutuhan aplikasi khusus dan dengan demikian ukuran mereka, meskipun tergantung pada
kebutuhan aplikasi ini, cenderung lebih kecil. Ontologi lainnya adalah data-dependent,
mana mereka terutama dibangun untuk mewakili dan meningkatkan aksesibilitas untuk koleksi data.

c. Tampilkan nilai tambah
Tujuan dari penyediaan akses yang lebih baik untuk informasi secara alami tidak cukup untuk memenangkan bunga, dukungan, dan partisipasi aktif dari penyedia informasi. Hal ini penting untuk menunjukkan contoh-contoh di mana dan apa nilai tambah integrasi dan akses bersama akan.
Kebanyakan organisasi memiliki kebutuhan, dan prosedur kadang-kadang melelahkan, untuk mendapatkan data dan informasi dari sumber-sumber lain. Sangat penting untuk menggambarkan manfaat langsung berpartisipasi dalam saluran pertukaran semantik diaktifkan konten, terutama dengan respect untuk memeriksa konsistensi, relatif mudah integrasi dan didistribusikan query, dan
data / informasi pertukaran dan penggabungan. Integrasi dari berbagai sumber konten menambah nilai argumen pengetahuan dan verifikasi. Mengintegrasikan dataset dapat memberikan wawasan yang berguna dalam kualitas dari dataset untuk operator yang terlibat. Ini membantu mengungkap kesalahan dan inkonsistensi dalam kumpulan, serta menyoroti kesenjangan pengetahuan.

2. Membangun Aplikasi SW
Kami mengikuti prinsip-prinsip di atas dalam dua program membangun aplikasi SW. Pertama adalah untuk badan-badan Pemerintah Inggris, untuk menunjukkan kepada mereka bagaimana teknologi SW dapat memfasilitasi akses terhadap informasi sektor publik, dan yang kedua adalah contoh di industri penerbangan, untuk membangun sebuah portal untuk integrasi data dan berbagi. Langkah-langkah kami mengambil untuk setiap aplikasi yang sangat mirip: (1) mendapatkan data, (2) desain dan membangun ontologi untuk data ini, (3) mengkonversi data ke tiga kali lipat RDF dan menyimpan di toko tiga, (4) menciptakan beberapa link antara ontologi dan KBS, kemudian (5) menunjukkan nilai tambah

a. Konstruksi Ontologi
Seperti yang dinyatakan sebelumnya, salah satu prinsip kami untuk membangun aplikasi SW adalah untuk memastikan ontologi kita membangun untuk dataset yang diberikan adalah kompleksitas rendah dan terbatas dalam lingkup dan ukuran. Ontologi kecil lebih murah dan lebih mudah untuk membangun, memelihara, memahami, digunakan, dan berkomitmen untuk. Kami menemukan bahwa tidak ada database yang dimiliki oleh organisasi yang berpartisipasi diperlukan lebih dari sejumlah kecil konsep dan hubungan untuk mewakili informasi yang tersimpan. Ketika membangun aplikasi ini kami ingin menunjukkan bahwa ontologi tidak sulit untuk membangun jika tujuan mereka adalah mewakili database dan aset informasi dibatasi lingkup. Kami juga ingin menunjukkan bahwa tidak perlu untuk semua orang untuk datang ke common, menyetujui konsensus tentang kosa kata, dan bahwa berkat teknik pemetaan ontologi, terminologi lokal dapat terbukti sangat berguna. Sangat menarik untuk dicatat bahwa jumlah rata-rata kelas dalam ontologi kami adalah 30, dengan rata-rata 10.

b. Menghasilkan RDF
Dari ontologi, kita mampu membuat turunan dengan menjalankan skrip sederhana di atas data untuk menghasilkan RDF. Script awalnya linting tangan khusus untuk tertentu database / pasangan ontologi, dan digunakan kembali jika mungkin di database yang sama dan ontologi. Meskipun mereka secara manual dibangun, kerangka kerja untuk generasi script semi-otomatis tidak akan terbayangkan. Sebagian besar naskah ditulis menggunakan API Jena, 6 dan sehingga telah dapat digunakan kembali dan mudah untuk tune untuk data baru dan ontologi. Kami menunjukkan kepada peserta relatif mudah mengkonversi data lama untuk RDF menggunakan bebas dan teknologinya sederhana. Meskipun kami perlu ontologi kecil untuk intepret data, kami juga membutuhkan scalable KB untuk memegang jutaan RDF tiga kali lipat yang dihasilkan. Kami menggunakan 3Store7, sebuah RDF triple-toko dikembangkan di Akt project8, untuk menyimpan RDF file yang dihasilkan. Ini triple-toko menyediakan endpoint SPARQL, sebuah servlet yang menerima permintaan SPARQL dan hasil pengembalian dalam XML

c.  Peran Dasar URI
Sebuah prinsip utama adalah bahwa semua entitas kepentingan, seperti sumber daya informasi, dunia nyata objek, dan istilah kosakata harus diidentifikasi dengan referensi URI. Setelah kami Referensi URI kita bisa bersikeras bahwa mereka harus dereferenceable, yang berarti bahwa sebuah aplikasi  dapat melihat sebuah URI melalui protokol HTTP dan mengambil data RDF tentang mengidentifikasi sumber daya.

d. Berpindah ke Web Semantik
Penggunaan kembali URI meningkatkan konektivitas antara data yang diterbitkan dan dengan demikian memfasilitasi data yang terkait menemukan [3]. Namun, kadang-kadang tidak jelas siapa yang harus digunakan kembali yang URI, terutama bila organisasi tidak berpengalaman dalam bidang ini, atau tidak menyadari upaya lain untuk memperkaya semantik data. Namun demikian, ontologi dapat dihubungkan satu sama lain dengan pemetaan URI setara mereka. Ontologi memungkinkan integrasi terjadi menggunakan ‘lunak’ pemetaan antara konsep dan kasus yang query atau browser data dapat mengikuti untuk menemukan entitas serupa atau digandakan. Dalam pekerjaan kami, kami menggunakan burung hantu khusus: properti sameAs untuk menghubungkan setiap entitas yang dipetakan. Dengan KBS menghubungkan kita dengan cara ini kita mampu menyediakan fleksibilitas yang lebih besar dan query daya dari struktur data yang asli dapat menyediakan.

3. Pemetaan
Sebagai contoh, kami mengembangkan dua ontologi untuk data dari Lewisham Borough Council. Setiap ontologi memiliki kelas-kelas yang mewakili properti, alamat, dan kode pos. Konsep-konsep ini dikaitkan dengan burung hantu: sameAs untuk menunjukkan bahwa mereka mewakili konsep yang sama. Ada juga banyak pemetaan sederhana tersedia, seperti pemetaan konsep Aktiva dari ontologi Aktiva Pangan Camden ke kelas Property di Tanah dan Properti ontologi Camden. Namun pemetaan kesederhanaan tersebut masih dapat kuat. Instance kode pos N6 6DS dalam satu peta KB ke pc N66DS contoh di negara lain. Karena hal benar-benar merujuk pada objek yang sama kami dapat menyimpulkan lebih banyak dengan mencatat identitas. Pada kenyataannya, kita
menemukan bahwa hanya menghubungkan ke satu obyek data (kode pos itu) sudah cukup untuk mengumpulkan berguna informasi dari berbagai dataset pembuatan aplikasi mashup yang menarik

4. Obyektif Sistem
Dengan drive saat ini untuk meminimalkan emisi, ada kebutuhan mendesak untuk lebih dekat mendefinisikan dan meningkatkan komponen / kinerja lapisan. Hal ini sulit. Apa yang dibutuhkan adalah suatu sistem yang mengandung berbagai jenis data pelapisan dan kinerja dari yang desainer dapat memeriksa pilihan bahan-lapisan-layanan dengan lingkup yang lebih luas. Dalam contoh pertama sistem ini akan bertujuan untuk membantu desainer dan insinyur mengidentifikasi spesifik celah dalam pengetahuan yang dapat diatasi. Namun, itu akan menyediakan suatu kerangka untuk membangun sebuah alat desain strategis penting. Ada tiga tujuan utama yang mendasari aplikasi MRO Expressway:

(1) untuk mengkonsolidasikan data dari berbagai sumber heterogen ke representasi tunggal
yang memfasilitasi ekstraksi informasi yang tidak mungkin dari individu sumber

(2) untuk menyediakan antarmuka grafis untuk melihat dan menjelajahi data,

(3) untuk meramalkan MRO pelapisan ulang masa depan bisnis dengan memperkirakan jumlah pesawat dan mesin dalam operasi pada tingkat regional. Tujuan-tujuan ini, tentu saja, adalah khas dari keuntungan yang dapat diharapkan dari menghubungkan dan memperkaya semantik data.

Sumber :
http://www.webscience.org
http://id.wikipedia.org/wiki/Web_semantik