Optimálny návrh experimentu aj anomálie v dátach:

Algoritmus vedcov FMFI UK publikoval prestížny americký časopis.


07. 05. 2020 22.59 hod.
Od: Lenka Filová

Vhodný návrh experimentu má vo vede kľúčovú úlohu. Umožňuje nám vykonávať merania alebo pozorovania tak, aby sme z experimentu získali relevantnú informáciu. Jedným typom návrhu experimentu je takzvaný "optimálny" návrh, ktorý je cielený na získanie maximálneho množstva informácie o neznámych parametroch použitého štatistického modelu. Pre väčšinu modelov využívaných v praktických situáciách však nepoznáme analytický tvar optimálneho návrhu experimentu. Preto sa venuje veľa pozornosti spôsobom, ako určiť optimálne návrhy numerickými metódami.

V článku "A Randomized Exchange Algorithm for Computing Optimal Approximate Designs of Experiments", ktorý práve vyšiel v špičkovom časopise Journal of the American Statistical Association, sme predstavili znáhodnený algoritmus na výpočet optimálnych návrhov experimetov (REX). Numericky sme ukázali, že REX vo väčšine situácií prekonáva aj najlepšie dosiaľ známe algoritmy, najmä v prípade náhodne generovaných alebo inak neštrukturovaných regresorov, a že jeho výkonnosť so zvyšujúcim sa priestorom bodov návrhu a zvyšujúcim sa počtom parametrov klesá pomalšie ako v prípade konkurenčných metód. Pritom ide o algoritmus, ktorý je stručný, má nízku pamäťovú náročnosť a nevyužíva žiadne špecializované solvery matematického programovania. Navyše, pre D-optimalitu, čo je najpoužívanejšie kritérium optimality, sme ukázali konvergenciu algoritmu REX ku globálnemu optimu. 

Tento algoritmus sa dá priamo použiť aj na riešenie problému konštrukcie elipsoidu s minimálnym objemom, ktorý obsahuje zadanú množinu bodov (problém MVEE), kde dosahuje vynikajúce výsledky aj pre problémy s veľkým počtom bodov vysokej dimenzie. Samotný MVEE sa dá použiť napríklad na konštrukciu robustného odhadu viacrozmernej polohy a rozptylu mnohorozmerných dát, alebo na detekciu odľahlých pozorovaní a anomálií v dátach. 

Článok bol vypracovaný tímom troch slovenských autorov, ktorí sú všetci absolventi FMFI UK, pričom dvaja z nich na FMFI UK v súčasnosti pracujú ako pedagógovia Katedry aplikovanej matematiky a štatistiky. 

Ilustračný obrázok znázorňuje priemet štyroch desaťrozmerných telies do trojrozmerného priestoru. Červené body zobrazujú miesta dotyku týchto telies o elipsoidmi najmenšieho možného objemu, ktoré dané telesá pokrývajú. Výpočet bol realizovaný pomocou algoritmu REX. 

Harman, Radoslav, Lenka Filová, and Peter Richtárik. "A randomized exchange algorithm for computing optimal approximate designs of experiments." Journal of the American Statistical Association 115, no. 529 (2020): 348-361.