Caratteristiche
SemEdge SP è una soluzione modulare, scalabile, personalizzabile e implementabile con rapidità e gradualità.
È aperta e in grado di integrarsi facilmente nel sistema informativo aziendale normalizzando e integrando efficacemente informazioni provenienti da fonti distribuite ed eterogenee (Web, database, e-mail, documenti ecc.), strutturate e non strutturate, di diverso formato e lingua.
Utilizzando algoritmi basati su regole di analisi linguistica, associati a una rete semantica e a una ontologia di dominio, SemEdge SP è in grado di comprendere il "significato" dei contenuti, con un’analisi testuale che va oltre il livello delle parole e delle ambiguità delle espressioni linguistiche per individuare i concetti chiave e le correlazioni tra di essi.
L'adozione di formati per la rappresentazione e l'archiviazione della conoscenza basati su XML (eXtensible Markup Language) garantisce architetture aperte e interoperabilità con sistemi legacy.
SemEdge SP offre un'insieme completo di funzionalità per la realizzazione di sistemi di gestione della conoscenza:
- Acquisizione delle informazioni
- Analisi, comprensione ed indicizzazione
- Ricerca e Navigazione
- Classificazione automatica multidimensionale
- Estrazione di conoscenza
- WEB 2.0
Acquisizione delle informazioni
SemEdge SP rende disponibili una serie di connettori, facilmente configurabili, per l'acquisizione delle informazioni da differenti fonti e da diversi formati.
E' possibile importare informazioni da: News & Rss Feeds, Social Media, eMail & SMS, documentazione interna, business applications, database, Rich Media, XML, ecc. Sono disponibili set di API per sviluppo di connettori ad hoc.
Analisi, comprensione ed indicizzazione
Le tecnologie di "Natural Language Processing" (NLP) di SemEdge SP consentono:
- L'analisi morfologica e l'indicizzazione delle forme di base (lemmi) per le lingue italiana, francese, inglese e spagnola. E' possibile implementare ricerche cross-language oppure effettuare separatamente interrogazioni nelle singole lingue. Per ulteriori 15 lingue sono disponibili gli stemmer, ovvero algoritmi in grado di rimuovere le terminazioni flessionali delle parole. E' possibile la creazione di lessici di dominio specializzati.
- L'estrazione automatica dei concetti: questa funzionalità permette l'indicizzazione e il recupero dei documenti basato sul riconoscimento dei concetti, ossia di una sequenza di parole linguisticamente motivata.
Ricerca e Navigazione
- Ricerca in linguaggio naturale: l'utente può interrogare la base dati con una semplice keyword o con una frase strutturata;
- Ricerca predittiva: suggerimenti automatici contestuali alla digitazione della query basati sui contenuti concettuali della knowledge base di riferimento;
- Supporto automatico alla ricerca: il sistema è in grado di presentare all'utente, aiutandolo nella navigazione, dei sottoinsiemi della base dati omogenei per significato semantico (per es.: se l’utente ricerca “bilancio” il motore può proporre “documento di programmazione economica”, “legge finanziaria”, "bilancio personale",...);
- Correzione ricerca: in caso di mispelling del termine ricercato il sistema suggerisce la corretta digitazione;
- Ricerca Legacy: consente di combinare ricerche su dati strutturati e ricerche a testo libero;
- Espansione semantica della query: la stessa domanda può essere posta utilizzando parole/concetti differenti. Per migliorare l’ampiezza dei risultati ciascun termine della query viene espanso, utilizzando un dizionario dei sinonimi, in un insieme più ampio di termini. Il dizionario standard può essere arricchito da dizionari di dominio/personalizzati;
- Documenti correlati: consente di ricercare, per ogni documento, i documenti che presentano un certo grado di similarità;
- Elaborazione dei criteri di ranking e parametrizzazione dei risultati: consente di dare maggior risalto a determinati tipi di documenti o a sponsorizzare particolari link.
- Concept Cloud: evidenziazione degli elementi notevoli più frequenti per un certo insieme di documenti trovati: keyword, concetti, nomi propri, nomi geografici, ecc.;
- Navigazione relazionale: possibilità di navigare tra le categorie in modalità dinamica;
- Modalità combinata di navigazione dinamica e ricerca testuale;
- Tagging.
Classificazione automatica multidimensionale
E' basata sull’innovativa “metodologia a faccette” che consente di superare i limiti delle tassonomie tradizionali.
Questa metodologia introduce un approccio multidimensionale, sulla base del quale i contenuti sono descritti in funzione di molteplici “sfaccettature”, e possono essere trovati secondo molteplici criteri.
La classificazione multidimensionale aumenta la facilità d’uso dei contenuti, e grazie alla tassonomia navigabile offre spunti e suggerimenti impliciti per ulteriori percorsi di ricerca, avvicinandosi ai bisogni ed alle aspettative degli utenti.
Estrazione di conoscenza
- Riconoscimento di informazioni puntuali e di valore a partire da testi non strutturati per estrarre automaticamente riferimenti normativi, geografici, nomi propri, eventi e parole chiave notevoli;
- Clustering automatico: propone raggruppamamenti concettualmente omogenei di documentazione al fine di razionalizzare i contenuti aziendali;
- Gestione metadata e tagging XML;
- Sentiment Analysis.
WEB 2.0
Il Web 2.0 offre alle aziende un nuovo mondo di conoscenza in termini di contenuti focalizzati sugli utenti, accessibili, dinamici e user generated. SemEdge SP è Web 2.0 compliant.


Torna su