Негізгі ұсыныстар
- Жаңа AI арқылы жұмыс істейтін құрал тарихшыларға көне мәтіндерді шешуге көмектесе алады.
- Ithaca – зақымдалған жазулардың жетіспейтін мәтінін қалпына келтіре алатын, олардың бастапқы орнын анықтайтын және жасалған күнін анықтауға көмектесетін алғашқы терең нейрондық желі.
- AI мәтіннің орны мен күні сияқты жетіспейтін деректерді толтыру үшін пайдалы, себебі ол деректерді талдау арқылы өте күрделі үлгілерді үйренуде жақсы.
Жасанды интеллекттегі (AI) соңғы жетістіктер өткенді түсінуге күш салуда.
Ithaca, DeepMind компаниясының AI зерттеушілері құрастырған машиналық оқыту моделі жаңа мақалаға сәйкес жетіспейтін сөздерді және жазба тілдің орны мен күнін болжай алады. Бұл әрекет тарихшыларға көне қолжазбаларды шешуге көмектесуі мүмкін.
«Ithaca - бұл терең нейрондық желі, сондықтан ол деректердің үлкен көлемдерінде жасырын үлгілерді табуға керемет қабілетті», - деді тарихшы Теа Соммершильд, соңғы мақаланың авторлары, Lifewire-ге электрондық хатта. сұхбат. «Мұндай үлгілер мәтіндік (грамматикалық, синтаксистік немесе көптеген мәтіндер бойынша қайталанатын «формулаға» байланысты) немесе контекстік (мәтіндердің белгілі бір жанрларында дәйекті түрде кездесетін кейбір сөздер: мысалы, «одақ, синтаксистік» сөздері туралы айтылған классикалық Афинаның саяси жарлығы) болуы мүмкін. кеңес, жиналыс…').”
Өткенді ашу
Ithaca - бүлінген жазулардың жетіспейтін мәтінін қалпына келтіре алатын, олардың бастапқы орнын анықтайтын және жасалған күнін анықтауға көмектесетін алғашқы терең нейрондық желі, деді Соммершильд.
Итака Гомер Одиссеясындағы грек аралының атымен аталған. Зерттеушілер Ithaca зақымдалған мәтіндерді қалпына келтіруде 62% дәлдікке, олардың бастапқы орнын анықтауда 71% дәлдікке қол жеткізетінін және мәтіндердің шығу мерзімін 30 жыл ішінде көрсете алатынын анықтады.
Ithaca визуализация құралдары зерттеушілерге нәтижелерді түсіндіруді жеңілдетуге арналған. Қағаз авторлары тарихшылар көне мәтіндерді қалпына келтіру үшін жалғыз жұмыс істегенде 25% дәлдікке қол жеткізгенін жазды. Бірақ Ithaca қолданбасын пайдаланған кезде тарихшының өнімділігі 72%-ға дейін артады, бұл модельдің өнімділігінен асып түседі және адам мен машина ынтымақтастығы әлеуетін көрсетеді.
“Ithaca адам сарапшылары мен машиналық оқыту арасындағы ынтымақтастықтың өсіп келе жатқан маңыздылығын көрсететін түсіндірілетін нәтижелерді ұсынады және тапсырмаларды бірлесіп шешу үшін адам сарапшыларын терең оқыту архитектураларымен сәйкестендірудің екі адамның жеке (көмексіз) өнімділігінен қалай асып түсетінін көрсетеді. сол тапсырмалар бойынша үлгі », - деді Соммершильд Lifewire-ге.
Мәселен, қазіргі уақытта тарихшылар Сократ пен Перикл сияқты көрнекті тұлғалар өмір сүрген уақытта қабылданған маңызды афины жарлықтарының күні туралы келіспейді, деп жазды Зоммершильд блог жазбасында. Жарлықтар біздің дәуірімізге дейінгі 446/445 жылдарға дейін жазылған деп есептелді, дегенмен жаңа деректер біздің дәуірімізге дейінгі 420 жылдарды көрсетеді. «Кішкентай айырмашылық болып көрінгенімен, бұл жарлықтар классикалық Афинаның саяси тарихын түсіну үшін негіз болып табылады», - деп жазды ол
Итакаға ең жақын жұмыс - Соммершильд және оның әріптестері 2019 жылы шығарған Pythia деп аталатын алдыңғы машиналық оқыту құралы. Pythia терең нейрондық желілерді пайдаланатын алғашқы көне мәтінді қалпына келтіру үлгісі болды.
«Бүгінгі күні Ithaca - эпиграфтың жұмыс процесіндегі үш негізгі тапсырманы тұтастай шешуге арналған алғашқы модель», - деді Соммершильд электрондық хатта. «Ол Pythia-ның алдыңғы қатардағы заманауи нұсқасын ілгерілетіп қана қоймайды, сонымен қатар географиялық және хронологиялық атрибуция үшін терең оқытуды алғаш рет және бұрын-соңды болмаған ауқымда пайдаланады.”
AI тарихшыларға көмектеседі
AI мәтіннің орны мен күні сияқты жетіспейтін деректерді толтыру үшін пайдалы, өйткені ол деректерді талдау арқылы өте күрделі үлгілерді үйренуге жақсы, дейді Singulos Research AI компаниясының бас директоры Брэд Куинтон Lifewire-ке электрондық пошта арқылы.
«Машиналық оқыту әдістерін пайдалана отырып, AI, мысалы, берілген мәтін мен оның жасалған күні мен орны арасындағы үлгілерді табу үшін көптеген «белгілі жақсы» мысалдарды қарай алады», - деп қосты Квинтон. "Көбінесе бұл үлгілер соншалықты күрделі, сондықтан олар адам сарапшысына түсінікті болмайды."
Жетіспейтін деректерді болжау – машиналық оқытуға негізделген AI үшін ортақ тапсырма. Мысалы, OpenAI ұсынған GPT-3 сөйлемдегі жетіспейтін сөздерді немесе тіпті абзацтағы жетіспейтін сөйлемдерді болжай алады. Көптеген AI негізіндегі кескіндерді өңдеу жүйелері түпнұсқадан ненің жоғалғанын саналы түрде болжау арқылы бейне мен кескіндерді қалпына келтіру үшін пайдаланылды.
«Тұжырымдама бойынша зерттеушілер өнердің немесе құралдардың немесе басқа да тарихи жасанды артефакттардың шығу күні мен шығу тегін анықтау үшін ұқсас әдістерді пайдалана алады, онда уақыт өте келе стилі мен техникасы және оның орналасуына қарай өзгереді деп күтілуде. шыққан », - деді Куинтон.