Projek Carabela: Kecerdasan buatan untuk mengungkap rahsia sejarah Sepanyol

Projek Carabela: Kecerdasan buatan untuk mengungkap rahsia sejarah Sepanyol


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Kecerdasan Buatan (AI) dan Pembelajaran Mesin (ML) untuk perkhidmatan sejarawan, bersama dengan algoritma yang mencari dokumen yang menarik untuk sejarah Sepanyol. Di sebalik itu Projek Carabela, sebuah projek yang dibangunkan dalam dua tahun terakhir oleh penyelidik dari Universitat Politècnica de València (UPV) dan Pusat Arkeologi Bawah Laut Institut Warisan Sejarah Andalusia.

Dalam kerangka ini mereka telah mengembangkan dan menerapkan teknik AI / ML baru yang membenarkan akses ke kandungan lebih dari 130,000 gambar dari Arkib Umum Hindia dan Arkib Sejarah Provinsi Cádiz. Projek ini telah mendapat sokongan daripada program Bantuan Yayasan BBVA untuk Pasukan Penyelidikan Ilmiah, di bidang Kemanusiaan Digital.

"Dengan teknik-teknik ini kita dapat melacak dokumen grafik apa pun dengan kecepatan yang sama seperti mesin pencari web, mengenal pasti kata-kata tertentu, kombinasi kata, frasa, dll .... Semua ini berkat model statistik yang telah kami latih dari contoh dan yang kini menjadi sekutu terbaik untuk kajian koleksi ini dalam sejarah Sepanyol. Dan kaedah yang sama juga dapat diterapkan pada banyak dokumen sejarah lain, ”kata Enrique Vidal, penyelidik di pusat Pengenalan Pola dan Teknologi Bahasa Manusia (PRHLT) UPV.

Arkib Umum Hindia

The dana Arkib Umum Hindia Mereka sangat berminat untuk mengkaji sejarah Sepanyol di Amerika - dari selatan Amerika Syarikat hingga Tierra de Fuego - dan Filipina pada abad ke-15 hingga ke-19.

Ia tentang manuskrip yang berkaitan dengan perjalanan dan perdagangan tentera laut Sepanyol, yang analisisnya tidak dapat dilakukan dengan teknik transkripsi OCR tradisional - kerana ini dimaksudkan untuk teks bercetak - atau dengan teknik khusus untuk bahan tulisan tangan, kerana hasil yang mereka tawarkan ketika diterapkan pada teks sejarah ini terlalu tidak tepat.

"Carabela telah memungkinkan kita untuk melangkah lebih jauh, dengan teknik pembelajaran automatik yang memungkinkan pengindeksan gambar teks tulisan tangan dalam koleksi besar dokumen sejarah yang keadaan pemeliharaan dan gaya penulisannya hampir tidak mungkin bagi manusia untuk membaca dokumen mereka", kata Joan Andreu Sánchez, juga penyelidik di PRHLT-UPV.

Teknik-teknik ini dapat mengenal pasti dan mengetahui pelbagai jenis huruf yang digunakan dalam setiap tempoh di mana dokumen bertarikh dan bahkan menganalisis gambar yang kualitinya sangat rendah.

Kuncinya ada di kapasiti algoritma untuk mendapatkan model yang 'dipelajari' secara automatik dari contoh.

“Model seperti itu memerlukan data pembelajaran dalam jumlah yang sedikit untuk memperoleh hasil yang sangat memuaskan. Kaedah ini memungkinkan tindak balas yang memuaskan terhadap cabaran yang ditimbulkan oleh dokumen itu sendiri, seperti perbezaan ejaan, noda, atau kualiti gambar ”, tambah Vidal.

Dalam kes ini, pembelajaran dilakukan dengan kira-kira 500 halaman dari Archivo de Indias, yang dipilih dan ditranskrip oleh Carlos Alonso dan pasukan pakarnya dari Pusat Arkeologi Bawah Air.

Bangkai kapal dan Australia

Caravel telah menjadi terang maklumat manuskrip mengenai bangkai kapal yang merupakan warisan arkeologi pada skala pertama, kerana kekayaan sejarah dan budaya yang luar biasa. "Dengan demikian Carabela juga menyumbang untuk menghindari perampasan warisan terendam", jelas Joan Andreu Sánchez.

Tetapi, tidak diragukan lagi, salah satu penemuan paling mengejutkan dalam dana ini berlaku ketika, mencari istilah yang berkaitan dengan Australia, seperti 'Tierra Austral Incognita', surat dari awal abad ke-18 yang ditujukan kepada Raja Felipe V.

"Dalam surat ini, yang ditulis oleh Jesuit Andrés Serrano, kami telah menemukan rujukan yang sangat tepat untuk benua selatan yang berasal dari tahun 1705, jauh sebelum Kapten James Cook sampai ke pesisirnya pada tahun 1770. Data yang kurang diketahui mengenai sejarah Australia dan sekarang kami dapati dengan menerapkan teknik pencarian indeks dan probabilistik yang dikembangkan di pusat kami, ”jelas Enrique Vidal.

BACA, Zaman Keemasan dan Transkribus

Sepanjang perjalanan yang sama ini, pasukan PRHLT telah mengambil bahagian dalam projek READ Eropah, yang telah mengkaji dan menganalisis dokumen kesusasteraan Sepanyol Zaman Emas, antaranya Manuskrip Lope de Vega dari koleksi Perpustakaan Negara, dan surat-menyurat dari Brothers Grimm dari Arkib Negeri Marburg.

Juga dari Arkib Nasional Finland, yang mana kira-kira 150.000 halaman telah diindeks, dan dalam projek masa depan ia bermaksud untuk mengindeks sekitar 1 juta halaman.

Juga, Dalam kerangka projek, Transkribus telah dikembangkan, platform perisian yang membolehkan memberi penjelasan gambar dokumen lama yang bernilai historiografi.

Transkribus digunakan terutamanya sebagai alat penjanaan data latihankerana teknik pengecaman teks tulisan tangan memerlukan data untuk belajar secara automatik. Dalam masa terdekat ini akan menggabungkan ciri-ciri lain, seperti latihan model automatik untuk bahasa lain.

READ juga telah menyimpulkan dengan penubuhan koperasi Eropah yang UPV adalah anggota pengasas dan yang menjadikan perisian Transkribus tersedia untuk semua pengguna yang berdaftar.

Pada masa ini, Platform Transkribus Ia mempunyai lebih daripada 30,000 pengguna dari seluruh dunia, yang menjadikannya alat rujukan antarabangsa untuk semua sejarawan.


Video: Robot Sophia Berkunjung ke Indonesia


Komen:

  1. Jarrett

    I agree, a useful thing

  2. Hlinka

    Think only!

  3. Fyfe

    Menawan!



Tulis mesej