6. Web Governance, Security & Standard


  Masalah umum pemerintahan Web adalah bahwa dengan struktur desentralisasi sulit untuk menegakkan standar, dan dengan jumlah yang sangat besar pengguna tidak terlatih atau relatif tidak tertarik hal harus dipelihara sangat sederhana.
  Di sisi lain, sama benar bahwa ada sejumlah platform, proto-cols dan arsitektur yang memfasilitasi keamanan informasi, tetapi yang tidak banyak digunakan. Dan kendala tambahan bahwa infrastruktur harus mengaktifkan keamanan, privasi, dan kepercayaan tanpa mengganggu pengguna dengan konstan informasi atau permohonan permissions.

6.1 Standard & Policies (Standar & Kebijakan)

Tujuan dirancangnya Standar & Kebijakan :
  1. Untuk membuat perilaku yang lebih baik, lebih mudah,  dan lebih mungkin.
  2. Untuk mengidentifikasi pelanggaran dan membasmi perilaku buruk.

 Kebijakan kesadaran memastikan pengguna memiliki pandangan yang dapat di akses dan dapat dimengerti kebijakan yang terkait dengan sumber daya web tertentu, Kebijakan kesadaran dapat membuat seseorang menjadi jengkel misalnya seperti penggunaan password rutin yang dikendalikan akses. 
 Weitzner et al menggambarkan dilema seseorang menginginkan sementara akses ke materi yang terbatas. Meningkatkan risiko keamanan kelas, orang itu memungkinkan dia atau dia untuk melihat materi yang terbatas, sementara declassifying risiko-risiko material memungkinkan orang lain mengakses itu
 Bahasa perwakilan kebijakan berdasarkan OWL, dan Rei. Adapun untuk mengontrol akses menggunakan kebijakan digambarkan dengan menggunakan ontologi OWL
Keuntungan akses dari penggunaan ontologi OWL :
  1. Membuat saran tentang control akses menjadi menarik
  2. Berbagi informasi dalam sistem terdistribusi agen atau layanan web.
6.2 Copyrights Issues (Isu-isu Hak Cipta)

  Karena Web adalah sebuah ruang informasi, penting membuat sebuah hak cipta dan kekayaan intelektual.
 Tujuan dari Hak Cipta:
  1. Melindungi sebuah ekspresi dari ide.
  2. Mencegah orang lain membajak, mengatakan bahwa memiliki sebuah konsep web yang sama.

  Ada sebuah kasus di AS dan Eropa yaitu sebuah database, diperlakukan sebagai sebuah kompilasi,dan telah menerima perlindungan yang sama sebagai karya sastra (yaitu dilindungi selama 50tahun setelah penciptaan dan 70tahun setelah kematian pencipta Inggris).
  Namun pada akhir 1990, database yang dilindungi selama 15 tahun mengalami perubahan besar yaitu mengenai pemilihan informasi dan susunan jumlah harus intelektual(cerdas) untuk memperoleh pemverifikasian atau kehadiran.
  Kemudian dari sebuah kasus itu terbentuk komunitas Semantic Web untuk menyatukan pendistribusian informasi dari berbagai relasional database dan untuk mempercepat penerbitan dan akses ke sejumlah besar data yang dikumpulkan oleh pemerintah di berbagai fungsi mereka.

6.3 Transgressive Behaviour (Perilaku Transgressive)

  Dalam banyak kasus, memahami bagaimana pelanggaran dapat berlangsung akan menyarankan metode untuk meruntuhkan pelanggaran, tetapi satu harus selalu siap untuk perlombaan senjata.
  Sebagai contoh paling menonjol subjek perlombaan senjata, algoritma Google PageRank adalah ukuran kualitas relevansi hebat yang terkenal. Jadi influential adalah Google pada pola penggunaan Web, PageRank harus beroperasi di dunia di mana banyak agen aktif berusaha untuk menumbangkan itu.


6.4 Privacy & Identity (Identitas & Privasi)

 Masalah lainnya, seperti spam, yang mengkhawatirkan orang banyak adalah privasi. Web memungkinkan pengumpulan data (informasi) yang belum pernah terjadi sebelumnya.
  Informasi yang sering digunakan untuk tujuan berbeda, dan keamanan data adalah semua terlalu sering diperlakukan sebagai masalah sisi oleh perusahaan.
   Untuk menjaga privasi dan identitas pribadi maka diperlukan sebuah fitur keamanan yang dapat kita gunakan dalam sebuah web, misalnya kata sandi, pin, ataupun pertanyaan-pertanyaan keamanan yang hanya diketahui oleh pemilik dari suatu web.

6.5 The Economics of Information (Informasi Ekonomi)

 Sebuah situs tidak hanya sebuah ruang politik, tapi juga sebuah ruang ekonomis, karena ilmu pengetahuan memiliki harga.
 Kemajuan Teknologi Informasi mempengaruhi segala Aspek Kehidupan salah satunya yang menonjol adalah penggunaan Teknologi Informasi dalam Bidang Ekonomi. kemajuan ini memberikan dampak positif dalam bidang perekonomian  salah satunya, yaitu :
  1. Pertumbuhan ekonomi yang semakin Tinggi
  2. Terjadinya Industrialisasi di berbagai daerah
6.6 A Liberal Hegemony (Hegemoni Liberal)

  Titik akhir singkat bernilai keputusan adalah bahwa web adalah ruang yang dirancang membiarkan arus informasi, dan untuk menciptakan kesempatan untuk kerjasama dan kolaborasi.
  Perlu bertanya mengapa arus informasi bebas adalah hal yang baik, dan jawaban yang cukup sederhana, karena ada baiknya untuk memiliki kebebasan untuk mengekspresikan diri agar seseorang dapat mengejar sendiri proyek otonom dan otentik. Tanpa hambatan kritik terhadap pemerintah dan pusat-pusat kekuasaan lainnya cenderung akan menyebabkan tata-pemerintahan yang lebih baik, informasi, dan lebih menggerakan demokrasi.
  Mungkinkah ada liberal hegemoni pada Web? Tentu saja ada bertentangan dengan banyak sumber-sumber dari Web (sebagian besar sumber wajar untuk mengatakan, lebih dari senang untuk mempekerjakan Web sebagai alat untuk organisasi, komunikasi dan penyebaran).
  Dan perlu diketahui, Hegemoni didefinisikan sebagai dominasi satu kelompok terhadap kelompok lainnya dengan atau tanpa ancaman kekerasan.Banyak pemerintah liberal yang membatasi warga-negara mereka menggunakan Web, sering menggunakan adaptasi dari teknologifirewall untuk menciptakan apa yang berlaku intranet raksasa dalam wilayah mereka.
  Bahkan non-liberal demokrasi memiliki sesuatu masalah dengan Web. Misalnya, pemerintah Singapura memiliki sentuhan yang relatif ringan di dalam peraturan internet, tapi masih blok 100 atau lebih situs porno, membutuhkan website politik dan agama harus terdaftar dan berlisensi dengan otoritas penyiaran Singapura, dan melarang kegiatan pemilihan di Web selama kampanye pemilihan, meskipun memiliki visi yang kuat ekonomi berbasis pengetahuan dan salah satu pemerintah yang paling antusias di dunia sehubungan dengan IT.

5.4 Web Sociology(Web Sosiologi)

  

  Web adalah cermin untuk masyarakat manusia, dan reflects kepentingan, obsesi dan imperatif eksistensi manusia abad ke-21 yang diperpanjang rentang sangat luas (mungkin jangkauan terluas ruang informasi manusia) set nilai, budaya dan asumsi. Analisis istilah pencarian yang dimasukkan ke dalam Google cenderung menjadi sumber kunci untuk sejarawan masa depan. Dalam bagian ini kita akan melihat hubungan antara Web dan pengguna, pembaca dan penulis.

5.4.1 Communities of Interest(Menarik Masyarakat)

  Web telah melahirkan sejumlah novel dan menarik masyarakat dengan sifat menarik. Sebagai contoh, Massively Multiplayer Role-Playing Game Online (MMORPG). (90m orang) menggunakan Internet untuk tetap berhubungan dengan semacam kelompok; Laporan itu, oleh proyek penelitian Pew Internet, sangat informatif tentang cara-cara yang Amerika menggunakan Web untuk tetap berhubungan dengan segala macam kelompok-kelompok kepentingan.
  Beberapa metode berbasis struktur mengungkap cybercommunities masyarakat:
  • Proxy untuk kepercayaan (misalnya, kolaboratif bekerja atau email jaringan) juga dapat digunakan untuk memetakan penyebaran masyarakat bunga atau praktek, yang dapat memiliki benefit nyata di sejumlah daerah.
  • Evaluasi pendanaan program-program yang dirancang untuk mendorong penelitian interdisipliner dapat didukung oleh bukti-bukti untuk pembentukan atau sebaliknya komunitas baru dengan melihat pola kolaboratif bekerja.

  Interaksi penting terhadap masyarakat yang ada dalam tiga cara:
  1. meningkatkan transparansi,
  2. memungkinkan offline masyarakat untuk tumbuh melampaui batas-batas 'alami' mereka
  3. memungkinkan different, lebih codified, jenis komunikasi antara anggota komunitas
5.4.2 Information & Social Structures(Informasi & Struktur Sosial)


  Struktur sosial web tergantung pada struktur engineering yang mendasari bagiannya tingkat atas. Hal ini bukan untuk mengatakan bahwa pohon yang berstruktur buruk; di dunia berorientasi pohon XML adalah perbaikan pada baris-orientasi Unix. Pohon memungkinkan banyak kemungkinan yang penting, seperti desain top-down terstruktur, informasi bersembunyi dan tingkat kontrol yang dikombinasikan dengan flexibility. Tetapi perilaku dalam struktur semacam itu dibatasi: GOTO pernyataan dianggap berbahaya, misalnya, karena kontrol dari pengolahan hilang, dan analisis dan verification program menjadi sewenang-wenang keras.
   Inovasi teknik Web adalah yang menciptakan nilai tambah bagi penggunanya manusia. Dengan kata lain, GOTO ditingkat; Global GOTOs melegitimasi, karena ketika gerakan tersebut diperbolehkan kemungkinan dibuka kebetulan Reuse. Kembali dalam situasi yang dapat diprediksi, seperti yang terjadi dengan struktur hirarkis informasi, dapat juga terjadi di Web, dan GOTOs memiliki biaya mereka. Analisis interaksi dan kerjasama lebih sulit, sebagai Dijkstra diprediksi, dan juga sistem tergantung pada pemeliharaan dan berfungsinya ruang URI.
  Struktur informasi tidak hanya sosial berdasarkan struktur pada Web; pengguna lain memiliki satu set yang lebih berorientasi proses persyaratan. Bagi banyak isu yang penting tidak berbagi informasi tetapi agak berbagi pengetahuan; untuk pengguna seperti itu, kunci yang tidak begitu banyak untuk memberikan ontologi sebagai cara mengekspresikan workflow. Dan pemodelan informasi flow daripada negara telah memberikan rute yang menarik ke dalam penciptaan dan penemuan layanan Web.

5.4.3 Significance & Its Metric(Sebuah Metrik & Signifikan)

  Konsep yang berkaitan dengan penggunaan sumber daya Web tertentu dalam proses adalah significance. Significance dapat didekomposisi menjadi dua jenis metrik: relevansi dan kualitas :
  1. Relevansi terhubung ke ide query: Berapa banyak pertanyaan yang menangani halaman? Cara different menjawab pertanyaan itu telah menyebabkan perkembangan beberapa algoritma yang penting, tetapi ide dasarnya adalah bahwa halaman menangani permintaan ketika itu berisi informasi yang relevan dengan query atau mengarahkan pembaca ke sumber daya yang berisi informasi tersebut.
  2. Satu pendekatan adalah untuk melihat struktur hyperlink yang memberikan konteks untuk laman web, dan mencoba untuk menyimpulkan langkah-langkah relevansi dari struktur tersebut.

  TFxIDF memberikan Skor relevansi ke dokumen berdasarkan jumlah berat istilah permintaan dinormalisasi oleh panjang vektor Euclidian dokumen; bobot istilah dihitung sebagai cross-produk istilah frekuensi (TF) dan invers dokumen frekuensi (IDF). TF adalah ukuran dari frekuensi istilah kejadian dalam sebuah dokumen, sementara IDF adalah ukuran dari jumlah link dokumen yang mengandung istilah.

  Ada dua utama teknik untuk mengekstrak informasi berkualitas dari struktur hyperlink:
  1. Cocitation-berbasis metode didasarkan pada wawasan bahwa link ke atau dari halaman mungkin untuk mengkonotasi beberapa jenis kesamaan.
  2. Bersama-sama dengan metrik relevansi, kualitas metrik dapat kemudian peringkat hasil pencarian
5.4.4 Trust And Reputation(Kepercayaan Dan Reputasi)


  Kepercayaan adalah, tentu saja, faktor penting dalam pengembangan Web, di sejumlah bidang. Scientific atau makalah dipercaya untuk laporan hasil benar. Penulis halaman dipercaya untuk menjadi diri mereka katakan. Layanan web dipercaya untuk melakukan apa yang mereka katakan akan mereka lakukan tanpa merusak orang lain. Situs E-commerce dipercaya untuk membuat penggunaan yang tepat dari rincian kartu kredit, untuk mengirim barang yang dipesan, dan untuk menjaga data aman.
  Terdapat dua tingkat significance sehubungan dengan terbitnya kepercayaan di seluruh Web yang menuntut pendekatan:
  1. Pertama ada tingkat sistem secara keseluruhan, dimana seseorang mencoba untuk memverifikasi bahwa aturan-aturan yang mengatur interaksi memaksa semua aktor jujur.
  2. Kedua, ada tingkat individu, di mana satu harapan yang satu mitra interaktif atau lawan jujur, reciprocative dan mengikuti aturan.

  Mengingat pentingnya konten untuk pemetaan Web kepercayaan, maka mungkin saja bahwa teknik menghasilkan kepercayaan dapat memainkan peran yang sama dengan Web semantik sebagai algoritma seperti PageRank, yang ekstrak informasi dari struktur diterjemah link, bermain di WWW.

5.4.5 Trust II : Mechanising Proof(Bukti Mechanising)

  Satu pendapat seperti berpendapat Wittgenstein, bukti adalah gambar yang berdiri membutuhkan ratification, yang mendapat ketika kita bekerja melalui itu, hal yang meyakinkan kita. Ini menjelaskan dan menunjukkan kebenaran proposisi terbukti secara bersamaan.
  Jenis lain dari bukti mekanik dan algoritmik; ini mungkin lebih dapat diandalkan daripada bukti-sebagai-gambar, tapi diterima memerlukan itu harus diambil pada kepercayaan bahwa langkah-langkah dalam bukti dilakukan dengan benar. (a)Kepercayaan diperlukan karena bukti mungkin unsurveyable, dan (b) bahkan jika tidak tidak efficient atau biaya-effective untuk memeriksa bukti setiap mekanik dengan tangan.
   Fetzer berpendapat bahwa ada kebingungan gigih antara dua jenis bukti mekanis, satu urutan logis formula mana setiap rumus adalah aksioma baik berasal dari rumus di atas oleh aturan melestarikan kebenaran, dan lain yang dibuat oleh mesin.

5.4.6 Web Morality(Moralitas Web) 

  Pertanyaan moral dan etika adalah bagian penting dari agenda Web Science. Mereka diperlukan untuk pemahaman kita tentang cara kerja Web, dan, tidak kalah penting, bagaimana Web dapat tumbuh. Yang terpenting dalam ilmu Web adalah cara yang teknik, hubungan antara URI dan apa yang ditampilkan pada layar, tergantung pada Konvensi tertentu perilaku yang pada tingkat tertentu altruistik. Mungkin ada hal-hal untuk mengatakan tentang sanksi untuk menegakkan seperti perilaku yang baik, tapi itu tidak tempat ilmu Web untuk bekerja di luar cara memberikan kepemimpinan moral, atau bekerja keluar beberapa kali conflicts difficult yang keinginan untuk bertindak secara moral sering naik.
 Praktek penting, dan bagaimana mereka berhubungan dengan keinginan masyarakat untuk berperilaku dalam mode kooperatif. Analisis semacam itu dapat mengakibatkan kode perilaku yang tidak mungkin dilaksanakan tetapi yang rasa define perilaku moral dalam konteks Web. Moralitas dan teknik ternyata dihubungkan.
  Jumlah link bekerja benar-benar menolak cukup cepat. Percobaan yang disebutkan sebelumnya merangkak halaman web 150m selama 11 minggu, dan Minggu 9 peneliti telah kehilangan akses ke lebih dari 10% dari halaman tersebut (sekitar 4% telah menghilang dalam minggu pertama). Sekitar 3% kembali kesalahan 4XX, sebagian besar orang-404 kesalahan (tidak ditemukan), dan sebagian besar sisanya 403S. (dilarang). Sekitar 3% dari halaman diblokir oleh files robots.txt server Web yang dideteksi dan ditolak Web crawler. 2-3% dari kegagalan jaringan-terkait, seperti DNS lookup kegagalan, menolak koneksi atau timeout TCP, sementara sekitar 2% kesalahan 3XX, menunjukkan halaman telah dipindahkan. Domain .com dan .net adalah appar-ently offenders terburuk.
  Ini berarti bahwa memproduksi URI kebutuhan agak lebih berpikir dari satu akan membayangkan sebaliknya, bahwa webmaster harus berpikir secara rasional.












5.1 Makna,Supervienince,dan Simbol Grounding


5.2 Web Reasoning(Penalaran Web)

5.2.1 Plus Ca Change ?


  Proyek Umum di Artificial intelijen (AI) berusaha untuk menghasilkan umum pemecah masalah beradaptasi secara simbolis Deskripsi dan penalaran, yang kuat (dan prima facie wajar) driver AI penelitian melalui tahun 1960-an dan 1970-an, pada akhirnya kandas di difficulties menentukan segalanya yang dibutuhkan untuk komputer untuk alasan tentang situasi yang sewenang-wenang. Kegagalan ini menyebabkan nama meremehkan 'GOFAI' (baik Old Fashioned AI) untuk proyek.
  Beberapa berpendapat bahwa GOFAI terhalang oleh kegagalan untuk memecahkan masalah bingkai, fakta bahwa dunia nyata penalaran tampaknya menjadi sangat terletak, dan bahwa setiap deskripsi atau representasi dapat pernah dibatasi untuk berdamai dengan lokal significance – untuk mengerti apa-apa komputer harus mengerti segala sesuatu.
  Argumen AI-independen  yang tampaknya mendukung yang pro GOFAI, yang (misalnya) ' mengetahui bagaimana ' adalah hanya spesies 'mengetahui bahwa', dan bahwa prosedural pengetahuan adalah, apa pun penampilan, hubungan antara agen dan proposisi, tapi argumen seperti itu tampaknya tidak ditanggung oleh teknologi. Alternatif untuk GOFAI, hal ini berpendapat, relatif bodoh metode berdasarkan sintaks dan perhitungan numerik – metode ini 'bodoh' (seperti PageRank, IR, NLP) ternyata berperilaku lebih efektif. Di sisi lain, klaim bahwa Web, dan Baratdaya khususnya, akan memukul masalah yang sama seperti GOFAI perlu dilihat dalam konteks manipulasi, berbagi dan interogasi terhadap data relasional sebagai dibayangkan oleh program SW.

  Secara khusus, Baratdaya tidak mengandalkan, atau selalu bercita-cita untuk, produksi tingkat kecerdasan yang dibayangkan oleh teori GOFAI, Bouquet et al menggambarkan penutup cerobong asap (atau konteks-OWL), perpanjangan Owl yang memungkinkan bergantung pada konteks ontologi harus diwakili [41]. Dan setidaknya satu komentator telah melihat Baratdaya sebagai penyelamat potensi sistem pakar penelitian programmer. Sama atau terkait ilmu pengetahuan seharusnya menjadi lebih mudah beradaptasi untuk mengubah dan menggunakan kembali.

5.2.2 Alternative Ways of Reasoning(Cara Alternatif Untuk Penalaran)

  Salah satu alternatif penalaran yaitu asosiatif penalaran, dimana penalaran berdasarkan asosiasi-yang dapat menjadi sangat tak terduga dan personalisasi-mengambil satu turun melatih pemikiran. Di Web, potensi asosiatif penalaran sangat besar, mengingat jumlah besar asosiatif hyperlink, dan sifat dunia kecil dari Web. Pencarian Google-seperti, berharga meskipun mereka tidak diragukan lagi, tidak seluruh cerita di dunia perangkat meresap kecil, agen perangkat lunak, dan sistem terdistribusi.
  Namun, penalaran asosiatif melalui hyperlink, walaupun metode yang menarik dan penting, bukanlah satu-satunya cara untuk pergi tentang itu. Jenis pemikiran ini tidak ketat asosiatif penalaran yang tepat, karena asosiasi adalah penulis, orang yang menempatkan yang hyperlink ke dokumen. Associativity adalah jelas salah satu pendorong utama dari Web sebagai toko pengetahuan dan sumber informasi. Asosiatif penalaran, misalnya, telah digunakan untuk filtering kolaboratif dalam sistem recommender.
   Penalaran dengan analogi bekerja dengan bercak karakteristik yang serupa antara dua sub proyek turnkey, dan kemudian dengan asumsi mata pelajaran yang lebih, Dalam sebuah domain yang digambarkan oleh beberapa ontologi, teknik-teknik penalaran analogis juga mungkin berguna sebagai alasan bergerak dari satu set ontologis Deskripsi lain, meskipun sama-sama perubahan sudut pandang mungkin juga masalah. Ada menarik upaya untuk mendukung analogis penalaran (yaitu CBR) di seberang kompleks pengetahuan desentralisasi struktur tersebut, dan juga ekstensi ke XML untuk mengungkapkan kasus berbasis pengetahuan.

5.2.3 Reasoning Under Incomsistency(Penalaran Di bawah Incomsistency)

   Untuk Web klasik prinsip ex falso quodlibet, bahwa konjungsi pernyataan dan penyangkalan yang mensyaratkan setiap proposisi apa pun, adalah jelas terlalu kuat. Menegakkan konsistensi memeriksa dan mencoba untuk melarang kontradiksi adalah non-starter berkat tekanan sosial terhadap inkonsistensi di Web, atau memang sistem terdistribusi berskala besar lainnya. Kemungkinan kesalahan (data yang tidak tepat entries) tentu tinggi. Kekuatan sosial ini membuat inkonsistensi tak terelakkan di berukuran bagian web- dan memang sudah telah mendorong banyak strategi penalaran di AI, dimana sistem dirancang dalam pengharapan harus mengatasi dengan bertentangan pengetahuan dasar, atau di mana ada kemungkinan bahwa pernyataan yang benar dalam model pada satu titik.
   Keuntungan utama dari klasik logika adalah bahwa skala. Oleh karena itu salah satu solusi untuk masalah inkonsistensi adalah untuk mengembangkan strategi untuk berurusan dengan kontradiksi seperti yang muncul. Selain itu, ini adalah kesempatan aplikasi untuk paraconsistent logika, yang memungkinkan ekspresi inkonsistensi tanpa bersifat deduktif sesuai. Logika Paraconsistent pelokalan effects inkonsistensi, sering memerlukan semantik relevansi dari proposisi yang digunakan dalam pemotongan (bukti ex falso quodlibet memerlukan konjungsi proposisi yang tidak relevan dengan kontradiktif yang), yang mencegah effects menyebar melampaui hotspot kontradiktif.
  Dalam istilah Web Science, masalah logika "benar" untuk Web akan tergantung pada konteks, tujuan analisis dan seterusnya. Tetapi jelas bahwa pemodelan Web sangat penting untuk sejumlah tujuan mana bukti-bukti diperlukan tentang apa dipertanggung jawabkan oleh serangkaian pernyataan.

5.3 Web Epistemology(Epistemologi Web)

  Komputer telah merevolusi Epistemologi, dan Web paling penting. Ide-ide seperti Web semantik bertahan kemungkinan perpanjangan otomatisasi pengolahan informasi.
  Ada dua pertanyaan epistemologis penting untuk Web Science:
  • Pertama adalah sifat-sifat apa platform masa depan harus memiliki untuk memungkinkan informasi sebanyak mungkin untuk tertarik ke Web tanpa memaksakan struktur atau mengatur teori atasnya? Salah satu tujuan dari Web adalah untuk memfasilitasi rasional diskusi ide-ide, daripada jenis-jenis serangan ad hominem rancorous yang membentuk agak terlalu banyak dari apa yang longgar disebut perdebatan.
  • Dan kedua, Web memiliki struktur yang secara radikal desentralisasi. Mengingat bahwa, tentu saja dapat digunakan sembrono atau jahat. Bagaimana kita dapat membuatnya lebih mungkin daripada kurang bahwa ilmu pengetahuan baik dan baik Epistemologi berakhir di Web, dan tidak takhayul? Memang, apakah itu hal yang baik? Pada umumnya, kebanyakan orang berperilaku dengan niat baik.

4. Analisis Web


4.1 Topologi Web

4.1.1 Struktur Web

  Topologi penyelidikan berusaha untuk membedakan struktur dari elemen dasar dari arsitektur dan hubungan antara mereka. Web topologi berisi lebih kompleksitas dari sederhana rantai linier, Dalam bagian ini, kita akan membahas percubaan untuk mengukur struktur global dari Web, dan bagaimana masing-masing halaman web fit ke dalam konteks itu. Ada pernyataan menarik bahwa define atau menyarankan properti penting? Misalnya, mungkin mungkin untuk memetakan pengetahuan di Web? Seperti peta mungkin mengizinkan kemungkinan pemahaman komunitas online, atau untuk terlibat dalam 'plume melacak'-mengikuti sebuah meme, atau ide, atau desas-desus, atau factoid, atau teori, dari pengecambahan untuk berbuah, atau sebaliknya, dengan menelusuri jalan ini muncul dalam berbagai halaman dan link mereka
  Metode analisis web mencari pola link ternyata menjadi sangat menarik, mencerahkan dan kuat dalam struktur mereka mengungkap. Misalnya, beberapa situs tampaknya diambil sebagai otoritatif di beberapa cara-dengan kata lain, banyak situs lain link ke mereka. Situs lainnya mengandung banyak link keluar-salah satu cara untuk hamil ini akan bahwa situs tersebut indeks otoritas pada beberapa topik- dan situs-situs berguna ini bertindak sebagai hub. Hub tersebut juga mungkin pihak berwenang, tapi sama mereka mungkin akan menunjuk ke beberapa halaman atau bahkan tidak ada halaman sama sekali. Ketika metode seperti yang dipelopori oleh Kleinberg, Brin dan Page mengambil matriks link Web dan studi eigenvectors, ternyata bahwa mereka sesuai dengan cluster di sekeliling konsep yang halaman sekitar. Struktur otoritas-hub seperti besar penting kepada pemahaman kita tentang Web, dan memerlukan analisis matriks link ke studi. Memang, asli Kleinberg's Tujuannya adalah untuk menemukan otoritas, dan kehadiran online struktur otoritas-hub lebih kompleks awalnya kejutan

4.1.2 Teori Grafik Penyelidikan

  Mungkin paling terkenal paradigma untuk mempelajari Web adalah teori grafik. Berbagai struktur makroskopik telah melihat dan diukur; misalnya satu merangkak dari lebih dari 200 juta halaman menemukan bahwa 90% dari Web benar-benar terhubung, jika link diambil sebagai non-directional, dan bahwa.
 56m Halaman ini adalah sangat terhubung  cf. . Struktur yang dengan demikian ditemukan sering disebut sebagai bentuk bowtie,seperti ditunjukkan pada gambar  'Simpul' dasi adalah sangat terhubung cluster (SCC) webgraph di mana ada sebuah jalan antara setiap pasangan node. SCC adalah flanked oleh dua set cluster, orang-orang yang link ke SCC tetapi dari yang ada tidak ada link kembali (ditandai sebagai dalam di figure), dan orang-orang yang terhubung ke dari SCC tetapi tidak menghubungkan kembali (keluar). Hubungan antara SCC, masuk dan keluar memberikan bentuk bowtie. Memang, struktur bowtie lazim di berbagai skala. Dill di al telah menemukan bahwa subset kecil dari Web juga memiliki bentuk bowtie, petunjuk bahwa Web memiliki sifat fraktal menarik-yaitu bahwa masing-masing daerah tematis-unified menampilkan (banyak) karakteristik yang sama dengan Web besar . Dengan cara ini sifat fraktal Web memberikan kita sebuah indikasi dari seberapa baik membawa kompromi antara stabilitas dan keragaman; sejumlah cukup konstan koneksi pada berbagai tingkat skala berarti komunikasi yang lebih effective.

3. Engineering The Web (Rekayasa Web)


3.2 Referensi & Identitas

  Semantic Web bergantung pada Konvensi penamaan dengan URI, dan tentu saja setiap bagian dari sistem label Web bergantung pada beberapa Konvensi atau lainnya. tetapi kurangnya sentralisasi memungkinkan skema different dan Konvensi, dan memang kecerobohan, untuk flourish, yang pada gilirannya membuka kemungkinan kegagalan referensi yang unik.

3.2.1 Referensi: Ketika Apakah dua objek yang sama?

  Di sisi lain, URI menyediakan Web sumber daya untuk menghindari setidaknya beberapa masalah grounding tradisional, ketika dapat diselesaikan bahwa dua istilah yang menunjuk ke URI sama. Jadi jika "bintang pagi" dan "malam bintang" menunjuk langsung ke maka setiap grounding lebih lanjut adalah super fluous.

  Di sisi lain, perbedaan kedua URI mungkin merujuk kepada objek yang sama bebas yang jelas, dan dapat melakukannya melalui hanya beberapa operasi yang digunakan. Sebuah metode heuristic untuk menyelesaikan bentrokan seperti itu, di dunia nyata, adalah untuk membuat penilaian cerdas yang didasarkan pada informasi agunan, dan ini telah menirukan online oleh perhitungan komunitas praktek nama, berdasarkan jaringan sekitarnya setiap sengketa kejadian hubungan.

3.2.2 Kapan adalah dua halaman yang sama?

   Mengambil masalah referensi alternatif adalah menentukan ketika halaman web dua halaman yang sama. Dasar pembuatan kesamaan penilaian tidak hanya perlu konten pada halaman, tapi bisa juga menjadi struktur hyperlink di mana halaman tertanam. Informasi yang mengharuskan pengguna tidak perlu datang dari satu halaman, tetapi sebaliknya dapat dikumpulkan dari gugus dokumen di sekitar topik dasar, dan begitu struktur hubungan yang ada dapat menjadi sangat penting. Dan cara yang lebih lanjut pemahaman kesamaan antara pola penggunaan tertentu halaman dua halaman sering Diakses pada titik-titik yang sama dalam sesi surfing Web.
  Kesamaan konten berbasis dapat didekati oleh pencocokan kata atau subsequences dari dua halaman. Teknik relatif sederhana dapat digunakan untuk menentukan kemiripan antara dua halaman (rasio antara ukuran persimpangan subsequences dan ukuran kesatuan mereka), dan penahanan satu dengan yang lain (rasio antara persimpangan dan ukuran dari set lengkap).

3.3 Web teknik: arah baru

  Pengembangan Web adalah campuran dari pengaturan standar, aktivitas terstruktur, desentralisasi dan inovasi, dan disengaja rekayasa. Sebagai contoh, PageRank memerlukan merangkak dan caching significant bagian web; Keberhasilan Google tergantung pada mampu menjaga cache tractable sementara juga dari ukuran significant. 
  Pelebaran cakupan pencarian untuk mencakup item seperti multimedia, Layanan atau komponen ontologi, juga akan membutuhkan mengejar program penelitian akademis, effective antarmuka dan model bisnis yang masuk akal, dan mengembangkan pendekatan untuk memanfaatkan Web harus diperpanjang ke lingkungan Web baru ketika mereka diciptakan (seperti jaringan P2P, misalnya).


3.3.1 Layanan Web

  Layanan web adalah didistribusikan potongan kode yang ditulis untuk menyelesaikan tugas-tugas specific, yang dapat berkomunikasi dengan layanan lainnya melalui pesan. Sejumlah metode menentukan proses telah berkembang selama beberapa tahun terakhir dan diterapkan ke domain layanan Web. Sebagai contoh, WS-Net adalah bahasa Deskripsi arsitektur berdasarkan teori berwarna Petri jaring (yaitu perpanjangan dari teori bersih Petri sederhana dengan dihargai.
  Layanan yang diperlukan untuk fungsi dan operasi internal. Hasil akhirnya adalah sebuah model yang meliputi global dan lokal aspek sistem. Layanan memfasilitasi integrasi layanan Web untuk mencapai tujuan baru, sementara juga menyediakan formalism untuk integrasi evaluasi. 
  Proses algebras juga telah diterapkan ke layanan. BPEL4WS adalah versi panjang dari bisnis proses eksekusi bahasa BPEL, yang menjadi cara yang semakin penting untuk interleave layanan Web dengan proses bisnis. BPEL memiliki batas-batas, tetapi memungkinkan penciptaan komposit layanan dari layanan yang ada. Tahap berikutnya adalah untuk menyesuaikan pendekatan ini untuk lingkungan P2P, dan saat ini sedang dikembangkan untuk itu CDL, alias WS CDL, alias koreografi (Web Layanan koreografi Deskripsi bahasa), sebuah bahasa berbasis XML untuk defining komplementer dan umum perilaku diamati di P2P kolaborasi. Tujuannya adalah bahwa dioperasikan P2P kolaborasi dapat disusun menggunakan koreografi tanpa seperti specifics sebagai platform yang mendasari yang sedang digunakan; Alih-alih fokus adalah tujuan umum kolaborator. Sedangkan BPEL memungkinkan layanan-layanan existing untuk digabungkan bersama-sama, koreografi bergeser fokus ke Deskripsi global kolaborasi, pertukaran informasi, memesan tindakan dan sebagainya, untuk mencapai tujuan yang telah disepakati.

3.3.2 Didistribusikan pendekatan: merasuk komputasi, P2P dan grid

  Komputasi mana-mana, P2P dan komputasi grid berbagi banyak masalah-masalah penelitian serius, terutama koordinasi perilaku dalam sistem berskala besar yang didistribusikan. Komputasi mana-mana pemerintah kecil, relatif rendah didukung perangkat komputasi tertanam dalam lingkungan pervasively berinteraksi dengan orang-orang. Misalnya, pencarian layanan di paradigma meresap harus mengambil tempat tanpa manusia dalam lingkaran. Layanan harus dapat mengiklankan diri mereka sendiri untuk memfasilitasi penemuan. Ini adalah salah satu contoh lingkungan komputasi yang sedang berkembang yang cenderung tumbuh dalam pentingnya. Dalam konteks Web Science dan mencari dan deskripsi invariants pengalaman Web, penting bahwa asumsi-asumsi yang kita buat mengenai lingkungan, dan teknologi yang hidup di dalamnya, diminimalkan jaringan P2P, ditandai dengan otonomi dari server pusat, intermiten konektivitas dan oportunistik penggunaan sumber daya, yang lain menarik lingkungan untuk generasi berikutnya Web.
  Godaan untuk mengeksploitasi secara radikal namanya decentralised lingkungan seperti jaringan P2P di generasi berikutnya dari Web kuat; desentralisasi adalah aspek kunci dari Web yang sukses. Jadi, misalnya, salah satu bisa membayangkan jaringan P2P yang digunakan untuk menemukan halaman cache untuk backup kegagalan atau kesalahan yang menyebabkan hilang halaman atau menggantung link. Sedangkan sistem P2P mengeksploitasi distribusi skala besar untuk mencapai banyak berakhir kecil, komputasi  grid adalah sering pendekatan terdistribusi untuk skala besar masalah menggunakan besar daya komputasi untuk menganalisis data dalam jumlah besar. Masalah-masalah koordinasi seperti ini selalu memiliki menjulang besar dalam berbagai disiplin ilmu, dan kita seharusnya tidak terkejut untuk studi mereka di pusat ilmu Web.

3.3.3 Personalisasi

  Personalisasi penting untuk meningkatkan nilai jaringan , dan peningkatan konsumen kunci . Recommender sistem yang jelas penerapan teknologi untuk mendapatkan effective personalisasi, harus ada terpadu penggunaan informasi dari berbagai sumber, termasuk data tentang pengguna (klik streaming, men-download data pola, online profiles), sumber daya yang disampaikan (konten situs, struktur situs) dan domain pengetahuan, bersama dengan data pertambangan teknik sufficient untuk menciptakan pandangan menyeluruh sumber daya yang mencakup banyak informasi yang dibutuhkan para pengguna.
  Mengingat bahwa, di Web, informasi yang relevan cenderung sangat didistribusikan dan dinamis, personalisasi diharapkan menjadi salah satu keuntungan besar dari Web semantik, yang adalah pre-nyata struktur yang memungkinkan penalaran melalui beberapa dan didistribusikan sumber data, Lain penting untai teknik personalisasi adalah pengembangan alat untuk mengaktifkan relatif neophytes untuk menciptakan atau meningkatkan artefak kompleks pengetahuan teknik, seperti ontologi atau pembungkus.

3.3.4 Multimedia

  Web adalah lingkungan yang multimedia, yang membuat untuk kompleks semantik, hal ini tentu saja tidak masalah unik ke Web. Meta penalaran dan Epistemologi sering menganggap media tekstual, meskipun sebenarnya banyak pertimbangan dalam bentuk analog. Sebagai hibrida menarik telah diusulkan bahwa kesenjangan semantik bisa mengisi dengan ontologi visual yang mencakup persyaratan tingkat rendah dan memberikan semacam pemetaan ke tingkat yang lebih tinggi konsep-konsep abstrak yang dinyatakan dalam permintaan dan metadata . 
  Infrastruktur seperti yang telah dibuat, menggunakan ontologi deskriptor visual (i) yang berdasarkan representasi RDF MPEG-7 visual deskriptor, Ontologi struktur multimedia (ii) berdasarkan skema multimedia Deskripsi MPEG-7 dan (iii) inti ontologi pemodelan primitif pada akar dari hirarki konsep yang dimaksudkan untuk bertindak sebagai jembatan antara ontologi, Semua dilengkapi dengan domain ontologi
  Tentu saja, media yang dibayangkan di sini adalah gambar dan video; pertanyaan terbuka penelitian tetap tidak hanya tentang seberapa jauh yang bisa di Cari oleh pendekatan seperti itu, tetapi juga tentang bagaimana berbagai media akan menyerah pendekatan seperti dalam cara yang integrable.

3.3.5 Pemrosesan Bahasa Alami

  NLP berkaitan dengan Web dalam beberapa cara. Di tempat pertama, bahasa alami adalah sangat jarang domain, yang kebanyakan kalimat yang diucapkan atau ditulis terjadi sekali saja atau sangat jarang, dan skala raksasa Web menyediakan korpus menarik untuk NLP penalaran.
  Kedua, mengingat masalah skala Web, teknik NLP akan penting dalam tugas-tugas seperti summarisation (Lihat, misalnya, dokumen pemahaman konferensi tahunan dan [69]), yang dapat memberikan dukungan berguna untuk bagian manusia dari tugas Cari.
  Ketiga, NLP memiliki potensi besar untuk pembangunan macam antarmuka intuitif yang heterogen dan tidak selalu melek komputer komunitas pengguna Web memerlukan. Memang itu mungkin membantu menjembatani kesenjangan antara visi SW Web terdiri dari data yang dimanipulasi secara logis, dan visi yang lebih tradisional dari Web sebagai tempat mana berguna dokumen yang diperoleh.
  Dengan demikian kita memiliki disanalogy langsung antara NLP dan SW, yang adalah bahwa URI, seperti kata-kata, pemilik, dan sehingga dapat diatur. Itu adalah bukan untuk mengatakan bahwa peraturan tersebut akan memastikan kekebalan dari drift makna bahwa ahli bahasa mendeteksi, tetapi mungkin menyediakan stabilitas sufficient atas pendek jangka menengah.