Web adalah cermin untuk masyarakat manusia, dan reflects kepentingan, obsesi dan imperatif eksistensi manusia abad ke-21 yang diperpanjang rentang sangat luas (mungkin jangkauan terluas ruang informasi manusia) set nilai, budaya dan asumsi. Analisis istilah pencarian yang dimasukkan ke dalam Google cenderung menjadi sumber kunci untuk sejarawan masa depan. Dalam bagian ini kita akan melihat hubungan antara Web dan pengguna, pembaca dan penulis.
5.4.1 Communities of Interest(Menarik Masyarakat)
Web telah melahirkan
sejumlah novel dan menarik masyarakat dengan sifat menarik. Sebagai contoh,
Massively Multiplayer Role-Playing Game Online (MMORPG). (90m orang)
menggunakan Internet untuk tetap berhubungan dengan semacam kelompok; Laporan
itu, oleh proyek penelitian Pew Internet, sangat informatif tentang cara-cara
yang Amerika menggunakan Web untuk tetap berhubungan dengan segala macam
kelompok-kelompok kepentingan.
Beberapa metode berbasis
struktur mengungkap cybercommunities masyarakat:
- Proxy untuk kepercayaan (misalnya, kolaboratif bekerja atau email jaringan) juga dapat digunakan untuk memetakan penyebaran masyarakat bunga atau praktek, yang dapat memiliki benefit nyata di sejumlah daerah.
- Evaluasi pendanaan program-program yang dirancang untuk mendorong penelitian interdisipliner dapat didukung oleh bukti-bukti untuk pembentukan atau sebaliknya komunitas baru dengan melihat pola kolaboratif bekerja.
Interaksi penting
terhadap masyarakat yang ada dalam tiga cara:
- meningkatkan transparansi,
- memungkinkan offline masyarakat untuk tumbuh melampaui batas-batas 'alami' mereka
- memungkinkan different, lebih codified, jenis komunikasi antara anggota komunitas
5.4.2 Information & Social Structures(Informasi & Struktur Sosial)
Struktur sosial web
tergantung pada struktur engineering yang mendasari bagiannya tingkat atas. Hal
ini bukan untuk mengatakan bahwa pohon yang berstruktur buruk; di dunia
berorientasi pohon XML adalah perbaikan pada baris-orientasi Unix. Pohon
memungkinkan banyak kemungkinan yang penting, seperti desain top-down
terstruktur, informasi bersembunyi dan tingkat kontrol yang dikombinasikan
dengan flexibility. Tetapi perilaku dalam struktur semacam itu dibatasi: GOTO
pernyataan dianggap berbahaya, misalnya, karena kontrol dari pengolahan hilang,
dan analisis dan verification program menjadi sewenang-wenang keras.
Inovasi teknik Web adalah
yang menciptakan nilai tambah bagi penggunanya manusia. Dengan kata lain, GOTO
ditingkat; Global GOTOs melegitimasi, karena ketika gerakan tersebut
diperbolehkan kemungkinan dibuka kebetulan Reuse. Kembali dalam situasi yang
dapat diprediksi, seperti yang terjadi dengan struktur hirarkis informasi,
dapat juga terjadi di Web, dan GOTOs memiliki biaya mereka. Analisis interaksi
dan kerjasama lebih sulit, sebagai Dijkstra diprediksi, dan juga sistem
tergantung pada pemeliharaan dan berfungsinya ruang URI.
Struktur informasi tidak
hanya sosial berdasarkan struktur pada Web; pengguna lain memiliki satu set
yang lebih berorientasi proses persyaratan. Bagi banyak isu yang penting tidak
berbagi informasi tetapi agak berbagi pengetahuan; untuk pengguna seperti itu,
kunci yang tidak begitu banyak untuk memberikan ontologi sebagai cara
mengekspresikan workflow. Dan pemodelan informasi flow daripada negara telah
memberikan rute yang menarik ke dalam penciptaan dan penemuan layanan Web.
5.4.3 Significance & Its Metric(Sebuah Metrik & Signifikan)
Konsep yang berkaitan
dengan penggunaan sumber daya Web tertentu dalam proses adalah significance. Significance
dapat didekomposisi menjadi dua jenis metrik: relevansi dan kualitas :
- Relevansi terhubung ke ide query: Berapa banyak pertanyaan yang menangani halaman? Cara different menjawab pertanyaan itu telah menyebabkan perkembangan beberapa algoritma yang penting, tetapi ide dasarnya adalah bahwa halaman menangani permintaan ketika itu berisi informasi yang relevan dengan query atau mengarahkan pembaca ke sumber daya yang berisi informasi tersebut.
- Satu pendekatan adalah untuk melihat struktur hyperlink yang memberikan konteks untuk laman web, dan mencoba untuk menyimpulkan langkah-langkah relevansi dari struktur tersebut.
TFxIDF memberikan Skor
relevansi ke dokumen berdasarkan jumlah berat istilah permintaan dinormalisasi
oleh panjang vektor Euclidian dokumen; bobot istilah dihitung sebagai
cross-produk istilah frekuensi (TF) dan invers dokumen frekuensi (IDF). TF
adalah ukuran dari frekuensi istilah kejadian dalam sebuah dokumen, sementara
IDF adalah ukuran dari jumlah link dokumen yang mengandung istilah.
Ada dua utama teknik
untuk mengekstrak informasi berkualitas dari struktur hyperlink:
- Cocitation-berbasis metode didasarkan pada wawasan bahwa link ke atau dari halaman mungkin untuk mengkonotasi beberapa jenis kesamaan.
- Bersama-sama dengan metrik relevansi, kualitas metrik dapat kemudian peringkat hasil pencarian
5.4.4 Trust And Reputation(Kepercayaan Dan Reputasi)
Kepercayaan adalah, tentu
saja, faktor penting dalam pengembangan Web, di sejumlah bidang. Scientific atau
makalah dipercaya untuk laporan hasil benar. Penulis halaman dipercaya untuk
menjadi diri mereka katakan. Layanan web dipercaya untuk melakukan apa yang
mereka katakan akan mereka lakukan tanpa merusak orang lain. Situs E-commerce
dipercaya untuk membuat penggunaan yang tepat dari rincian kartu kredit, untuk
mengirim barang yang dipesan, dan untuk menjaga data aman.
Terdapat dua tingkat
significance sehubungan dengan terbitnya kepercayaan di seluruh Web yang
menuntut pendekatan:
- Pertama ada tingkat sistem secara keseluruhan, dimana seseorang mencoba untuk memverifikasi bahwa aturan-aturan yang mengatur interaksi memaksa semua aktor jujur.
- Kedua, ada tingkat individu, di mana satu harapan yang satu mitra interaktif atau lawan jujur, reciprocative dan mengikuti aturan.
Mengingat pentingnya
konten untuk pemetaan Web kepercayaan, maka mungkin saja bahwa teknik
menghasilkan kepercayaan dapat memainkan peran yang sama dengan Web semantik
sebagai algoritma seperti PageRank, yang ekstrak informasi dari struktur
diterjemah link, bermain di WWW.
5.4.5 Trust II : Mechanising Proof(Bukti Mechanising)
Satu pendapat seperti berpendapat Wittgenstein, bukti adalah
gambar yang berdiri membutuhkan ratification, yang mendapat ketika kita bekerja
melalui itu, hal yang meyakinkan kita. Ini menjelaskan dan menunjukkan
kebenaran proposisi terbukti secara bersamaan.
Jenis lain dari bukti mekanik dan algoritmik; ini mungkin
lebih dapat diandalkan daripada bukti-sebagai-gambar, tapi diterima memerlukan
itu harus diambil pada kepercayaan bahwa langkah-langkah dalam bukti dilakukan
dengan benar. (a)Kepercayaan diperlukan karena bukti mungkin unsurveyable, dan
(b) bahkan jika tidak tidak efficient atau biaya-effective untuk memeriksa bukti
setiap mekanik dengan tangan.
Fetzer berpendapat bahwa ada kebingungan gigih antara dua
jenis bukti mekanis, satu urutan logis formula mana setiap rumus adalah aksioma
baik berasal dari rumus di atas oleh aturan melestarikan kebenaran, dan lain
yang dibuat oleh mesin.
5.4.6 Web Morality(Moralitas Web)
Pertanyaan moral dan etika
adalah bagian penting dari agenda Web Science. Mereka diperlukan untuk
pemahaman kita tentang cara kerja Web, dan, tidak kalah penting, bagaimana Web
dapat tumbuh. Yang terpenting dalam ilmu Web adalah cara yang teknik, hubungan
antara URI dan apa yang ditampilkan pada layar, tergantung pada Konvensi
tertentu perilaku yang pada tingkat tertentu altruistik. Mungkin ada hal-hal
untuk mengatakan tentang sanksi untuk menegakkan seperti perilaku yang baik,
tapi itu tidak tempat ilmu Web untuk bekerja di luar cara memberikan
kepemimpinan moral, atau bekerja keluar beberapa kali conflicts difficult yang
keinginan untuk bertindak secara moral sering naik.
Praktek penting, dan
bagaimana mereka berhubungan dengan keinginan masyarakat untuk berperilaku
dalam mode kooperatif. Analisis semacam itu dapat mengakibatkan kode perilaku
yang tidak mungkin dilaksanakan tetapi yang rasa define perilaku moral dalam
konteks Web. Moralitas dan teknik ternyata dihubungkan.
Jumlah link bekerja
benar-benar menolak cukup cepat. Percobaan yang disebutkan sebelumnya merangkak
halaman web 150m selama 11 minggu, dan Minggu 9 peneliti telah kehilangan akses
ke lebih dari 10% dari halaman tersebut (sekitar 4% telah menghilang dalam
minggu pertama). Sekitar 3% kembali kesalahan 4XX, sebagian besar orang-404
kesalahan (tidak ditemukan), dan sebagian besar sisanya 403S. (dilarang).
Sekitar 3% dari halaman diblokir oleh files robots.txt server Web yang dideteksi
dan ditolak Web crawler. 2-3% dari kegagalan jaringan-terkait, seperti DNS
lookup kegagalan, menolak koneksi atau timeout TCP, sementara sekitar 2%
kesalahan 3XX, menunjukkan halaman telah dipindahkan. Domain .com dan .net
adalah appar-ently offenders terburuk.
Ini berarti bahwa
memproduksi URI kebutuhan agak lebih berpikir dari satu akan membayangkan
sebaliknya, bahwa webmaster harus berpikir secara rasional.
Posting Komentar