Označbe predpakiranih živil poleg tekstovnih informacij, pogosto vsebujejo tudi grafične elemente oz. simbole, ki potrošnikom omogočajo hitrejše prepoznavanje lastnosti izdelka. Lahko nam sporočajo tako prehranske lastnosti izdelka kot tudi druge kvalitete, ki izdelke ločijo med seboj. Eden od teh primerov je oznaka Nutri-Score, ki označuje hranilno vrednost izdelkov s črkami od A (boljša hranilna sestava) do E (slabša hranilna sestava), kar omogoča lažje sprejemanje boljših prehranskih odločitev. Ekološki logotip EU po drugi strani zagotavlja, da je izdelek proizveden po strogih ekoloških standardih, s poudarkom na trajnostnih praksah. V-label pa označuje, da izdelek ne vsebuje sestavin živalskega izvora, kar je pomembno za posameznike, ki se prehranjujejo vegansko. Vse te oznake pomagajo potrošnikom izbrati živila glede na prehranske in etične preference. Spremljanje podatkov o pojavljanju tovrstnih simbolov pa lahko pripomore k razumevanju in spremljanju tržišča predpakiranih živil, ki močno oblikuje naše prehranske izbire.
Razvoj orodja NutriGreen za prepoznavanje oznak
Zbiranje podatkov o tovrstnih oznakah in logotipih je zahtevno in zamudno, zato so se raziskovalci na Institutu »Jožef Stefan« in Inštitutu za nutricionistiko lotili razvoja metode in algoritma za njihovo avtomatsko prepoznavanje. Uporabili so metodo umetne inteligence (AI), ki zahteva vhodne podatke za učenje t.i. modelov segmentacije za prepoznavanje različnih oznak na embalaži hrane.
Ker v slovenskem prostoru do zdaj še nismo razpolagali s tovrstnimi podatki, je bila prva naloga priprava zbirke podatkov, ki je bila poimenovana NutriGreen. Zbirko so raziskovalci sestavili iz slik blagovnih znamk živilskih izdelkov. Vsaka slika je označena (anotirana) s tremi različnimi atributi: enim, ki prikazuje prehransko kakovost izdelka na osnovi Nutri-Score oznake, drugim, ki označuje, ali je izdelek veganskega ali vegetarijanskega izvora na osnovi oznake v-label in tretjim, ki prikazuje EU ekološki (BIO) logotip.
Zbirka podatkov NutriGreen je bila ustvarjena z uporabo polavtomatskega postopka označevanja (anotacije) slik, ki povezuje tako anotacije domenskih strokovanjakov kot tudi avtomatske anotacije z uporabo modela globokega učenja. Tako ustvarjena zbirka je obsežna, saj vsebuje kar 10.472 slik, pri čemer je 1.250 slik označenih z Nutri-Score A, 1.107 slik z Nutri-Score B, 867 slik z Nutri-Score C, 1.001 slik z Nutri-Score D in 967 slik z Nutri-Score E. Poleg tega zajema 870 slik z oznako za v-label, 2.328 slik z BIO oznako in 3.201 slik brez oznak.
Objava rezultatov v znanstveni reviji
Zbirka NutriGreen je podrobneje predstavljena v članku, ki je bil objavljen marca 2024 v znanstveni reviji Frontiers in Nutrition. Članek opisuje tudi primer praktične uporabe zbirke podatkov slik, v katerem so avtorji prilagodili model segmentacije YOLOv5 in dosegli izjemno natančnost prepoznavanja prehranskih oznak (kar 94,0%).
Celotni članek je na voljo na:
Jan Drole, Igor Pravst, Tome Eftimov, Barbara Koroušić Seljak (2024) NutriGreen image dataset: a collection of annotated nutrition, organic, and vegan food products. Front. Nutr., 26 March 2024, Volume 11 – 2024, https://doi.org/10.3389/fnut.2024.1342823