Root NationXəbərlərİT xəbərləriFilmlərdəki kimi: Google-un yeni foto emal AI miqyasını genişləndirir və onları reallığa çevirir

Filmlərdəki kimi: Google-un yeni foto emal AI miqyasını genişləndirir və onları reallığa çevirir

-

Siz yəqin ki, baş qəhrəmanın şəkli böyütmək və nəticəni yaxşılaşdırmaq – üz, avtomobil nömrə nişanı və ya hər hansı digər əsas detalları göstərmək üçün xahiş etdiyi fantastik filmlər və ya televiziya şoularını görmüsünüz. Google-un ən son süni intellekt (AI) sistemlərinə əsaslanaraq sözdə diffuziya modelləri, bu hiyləni yerinə yetirə bilirlər.

Bu, mənimsənilməsi çətin bir prosesdir, çünki o, digər oxşar şəkillərə əsaslanan super ağıllı təxminlərdən istifadə edərək, kameranın ilkin olaraq çəkmədiyi təsvirə təfərrüatları əlavə edir.

google

Google-da bu texnika təbii görüntü sintezi adlanır və bu xüsusi ssenaridə ultra yüksək təsvir qətnaməsi. Kiçik, pikselli bir fotoşəkillə başlayırsınız və kəskin, aydın və təbii bir şeylə başa çatırsınız. Tam olaraq orijinal olmaya bilər, amma insan gözünə real görünəcək qədər yaxındır.

Google bu iş üçün iki yeni süni intellekt aləti təqdim edib. Birincisi SR3 və ya Təkrar Təmizləmə vasitəsilə Super Rezolyutsiya adlanır və o, görüntüyə səs-küy əlavə edərək, sonra onu silməklə işləyir. Şəkillərin böyük məlumat bazasına və bəzi maşın öyrənmə sehrinə əsaslanan bir sıra ehtimal hesablamaları vasitəsilə SR3 aşağı rezolyusiyaya malik piksel təsvirinin super yüksək keyfiyyətli versiyasının necə göründüyünü təsəvvür edə bilər.

İkinci vasitə CDM və ya Kaskad Diffuziya Modelləridir. Google bunları “boru kəmərləri” kimi təsvir edir ki, onlar boyunca diffuziya modelləri – o cümlədən SR3 – yüksək keyfiyyətli təsvirin ölçüsünü artırmaq üçün istiqamətləndirilə bilər. Təkmilləşdirmə modelləri götürür və onları daha böyük şəkillərə çevirir.

google

Google-a görə, müxtəlif qətnamələrdə müxtəlif təkmilləşdirmə modellərindən istifadə etməklə, CDM yanaşması alternativ təsvir ölçüsünü artırmaq üsullarını üstələyə bilir. Yeni süni intellekt mühərriki vizual obyektlərin tanınması sahəsində tədqiqatlar üçün geniş istifadə olunan təlim şəkillərinin nəhəng verilənlər bazası olan ImageNet-də sınaqdan keçirilib.

SR3 və CDM-in son nəticələri təsir edicidir. 50 insan könüllüsü ilə keçirilən standart testdə SR3 tərəfindən yaradılan insan üzlərinin təsvirləri zamanın təxminən 50%-də real fotolarla səhv salınıb və ideal alqoritmin 50%-ə çatması lazım olduğunu nəzərə alsaq, bu, təsir edicidir. Təkrar etmək lazımdır ki, bu gücləndirilmiş təsvirlər orijinallarla dəqiq uyğunluq deyil, onlar ehtimal riyaziyyatına əsaslanan diqqətlə hesablanmış simulyasiyalardır.

google

Google yeni süni intellekt mühərrikləri və əlaqəli texnologiyalardan daha çox şey vəd edir – təkcə üzlərin və digər təbii obyektlərin təsvirlərinin artırılması baxımından deyil, həm də ehtimal modelləşdirmənin digər sahələrində.

Həmçinin oxuyun:

Qeydiyyatdan keçmək
Haqqında məlumat verin
qonaq

0 Şərhlər
Daxil edilmiş rəylər
Bütün şərhlərə baxın