Crawler a reti neurali
Proponiamo una soluzione che è alla base del funzionamento dei motori di ricerca più conosciuti come ad esempio Google.com infatti è un crawler che attraverso un'architettura distribuita, consente di creare una sorta di “google istituzionale”, monitorando siti web preventivamente impostati. In base alla valorizzazione di alcuni parametri, il sistema permette di reiterare ricerche molto specifiche su portali e siti online, dando visibilità su informazioni e aggiornamenti nell'ambito di un determinato settore o argomento.
Il nostro web crawler offre un servizio di sorveglianza che consente di conoscere ogni nuovo nome di dominio generico (gTLD's) e nazionale di primo livello per codice Paese (ccTLD's) con lo scopo di far fronte con tempestività ad usi illeciti. Può essere utilizzato ad esempio, per il monitoraggio della rete allo scopo di conoscere ogni qualvolta un marchio (o un marchio simile) appare all'interno di un sito o come metatag identico o simile alla denominazione ricercata e che, pertanto, potrebbe entrare in conflitto con il marchio o il nome di dominio in questione; quindi attraverso controllo via Internet consente di rintracciare gli Url delle pagine Web che forniscono in modo illegale i prodotti, marchi ecc permettendo lo scarico periodico di un dominio, in considerazione del fatto che il web è uno spazio estremamente molto volatile.Il report viene presentato al Cliente con una elaborazione grafica frutto di una preventiva valutazione di massima del dominio (di colore verde se sembra di titolarità del cliente, di colore rosso per i domini che risulterebbero violare il diritto del titolare, di colore blu per quelli che sembrano legittimamente depositati da terzi).
Il report della sorveglianza fornisce anche la home page del sito, in modo che sia immediatamente visibile il settore merceologico a cui si riferisce. Per ogni nome di dominio vengono indicati il titolare, nonché le informazioni amministrative, tecniche e di contatto insieme alla storia precedente. Il rapporto viene consegnato per e-mail settimanalmente.
Questo servizio può essere accompagnato allo sviluppo di un portale per la visione e la conservazione della storia dei siti Web relativi all'oggetto di ricerca anche dopo la loro chiusura.
Contesti applicativi
- Individuare i canali distributivi online che promuovono e vendono prodotti e sostanze illegali e di contrabbando;
- Individuare i canali che contengono elementi e materiali pedopornografici, violenza, esortazione al suicidio, esortazione all'odio razziale ecc;
- Individuare i canali distributivi online che ne propongono la vendita diffusa tramite piattaforme e-commerce (website e-Commerce, e-Shop, ecc.) e delinearne gli attributi/caratteristiche principali;
- Individuare inserzioni con marchi distorti/imitativi e le loro principali caratteristiche (prezzi, provenienze, ecc.);
- Individuare inserzioni di prodotti a Marchio non corrispondenti ad aspetti tecnici e commerciali del DOP e IGP (es. prezzo, ecc.);
- Scoprire usi imitativi e distorti (Italian Sounding) più frequenti utilizzati per la vendita di prodotti concorrenti;
- Individuare usi nascosti per "traffic diversion", cioè spostamento di utenti da pagine web ufficiali a pagine concorrenti;
- Scoprire usi "parassitari", cioè citanti il Marchio ufficiale per promuovere abusivamente prodotti concorrenti;
- Evidenziare associazioni del Marchio con (eventuali) contenuti immorali/negativi;
- Mappare i brand concorrenti che competono più da vicino sul web e delineare elementi di distintività/immagine emergenti;
- La ricerca, nella modalità di cui sopra;
- L'autoapprendimento, in relazione al modello delle reti neurali;
Nell'autoapprendimento è fondamentale il ruolo dell'utente durante la prima fase perché deve addestrare la rete con degli esempi che contengono input e output associati. Così come lo è il ruolo del Crawler che deve estrarre delle informazioni di similitudine tra i dati forniti in input al fine di classificarli in categorie.
Reti neurali
Le reti neurali sono modelli matematici/informatici di calcolo basato sulle reti neurali biologiche e che hanno l’obiettivo di emulare il sistema nervoso centrale e di realizzare i meccanismi di apprendimento del cervello umano in modo che la rete interagisca con l’ambiente esterno senza l’intervento dell'individuo. Si basano sul concetto che, in determinate situazioni, è possibile far "apprendere" ad un apparato matematico determinate leggi che non si conoscono a priori.
Una rete neurale artificiale riceve segnali esterni su uno strato di nodi (unità di elaborazione) d'ingresso, ciascuno dei quali è collegato con numerosi nodi interni, organizzati in più livelli. Ogni nodo elabora i segnali ricevuti e trasmette il risultato a nodi successivi. In termini pratici possono essere utilizzate per simulare relazioni complesse tra ingressi e uscite che altre funzioni analitiche non riescono a rappresentare.
Esistono molti tipi di reti neurali che sono differenziati sulla base di alcune caratteristiche fondamentali, la divisione fondamentale è quella relativa al tipo di apprendimento che può essere supervisionato o non supervisionato: nel primo caso si addestra la rete con degli esempi che contengono un input e un'output associato, mentre nel secondo caso la rete deve essere in grado di estrarre delle informazioni di similitudine tra i dati forniti in input al fine di classificarli in categorie.



