ISO/IEC 25000 - SQuaRE

Requisiti di qualità del software, dati, servizi e QiU di sistemi IT e IA: concetti, misure e valutazioni

Intelligenza Artificiale ed Ecosistema Umano. Quali scenari per la Sanità

Roma, 16 maggio 2024,  Palazzo Giustiniani, Sala Zuccheri

Pasted Graphic 

in collaborazione con AiSDeT, Pontificia Academia Pro Vita, Ecosistematelemedicina.it, Innovazione per l’Italia

L’importanza della Data quality - Domenico Natale, Membro di CEN-CENELEC JTC 21 (IA), SC42 (IA), SC7 (Software Engineering), UNINFO-UNI.

(Segue versione in Inglese - English version is following)

Sono onorato di parlare in questa sala di qualità dei dati, un argomento sempre più importante. Il futuro del mondo, probabilmente, non dipenderà dal petrolio, ma dai dati. I dati saranno importanti come l’acqua. Similmente all’acqua (che deve essere pulita, non contaminata, protetta per la nostra sopravvivenza), i dati devono avere una elevata qualità per essere affidabili e non fuorviarci. Quando nel 2003 iniziarono i lavori internazionali ISO/UNI/UNINFO per definire il primo standard ISO sui dati, pubblicato nel 2008 come ISO/IEC 25012 “Data quality model”, nessuno pensava che questo argomento sarebbe divenuto così rilevante per tutti i settori dell’Industria e della Pubblica Amministrazione, ed anche per la stessa Intelligenza Artificiale vista oggi nel contesto europeo dell’AI Act.
 
Perché parlare di standard per la qualità dei dati? Perché gli standard hanno un ruolo importante per offrire prodotti migliori, armonizzando i termini e i processi, per facilitare la comunicazione, consentire sinergie, incrementare l’interoperabilità di sistemi e l’interscambio di dati, con semantica comune e metadati condivisi, contribuendo alla riduzione di costi e degli incidenti.

Un modo, ad esempio, per preservare i dati nella loro provenienza territoriale è quello di una loro raccolta sistematica con un procedimento bottom-up che parta dai comuni, province, regioni per arrivare a livelli nazionali ed europei con una certa gradualità, rapportabile alle dimensioni della popolazione interessata, osservando i dati nella loro evoluzione nel tempo affinché possano guidare nella comprensione dei fatti e prospettive.
 
E’ da considerare che i dati non sono un artefatto digitale, come spesso è il software, ma soprattutto rappresentano il fatto stesso e il criterio di verità per ognuno dei suoi aspetti. I dati sono quindi la realtà, la rappresentazione interpretabile di ciò che esiste. Sono gli elementi su cui poter basare le decisioni, i miglioramenti, gli sviluppi. I dati, che seguono le regole standard, non sono una convenzione, ma forniscono informazioni e conoscenza della realtà.
 
Chiunque di noi pretende che i dati possano soddisfare la maggior parte possibile delle seguenti 15 caratteristiche di qualità (inerenti e dipendenti dal sistema). Secondo il modello standard 25012, adottato a livello nazionale nel 2014 come UNI CEI ISO/IEC 25012, i dati devono soddisfare i seguenti aspetti: conformità alle leggi, devono essere riservati (GDPR), accurati cioè veritieri, aggiornati, coerenti, completi, credibili; inoltre, devono essere costruiti in modi accessibili alle persone con disabilità (Legge 4/2004), comprensibili, precisi, efficienti, tracciabili, disponibili (Open data), portabili da un sistema all’altro, messi in sicurezza per evitarne la perdita e consentirne il ripristino. Per i sistemi di Intelligenza artificiale, questi aspetti elencati sono in via di arricchimento in ambito internazionale ed europeo con ulteriori aspetti di qualità relativi ai gruppi di dati (dataset) affinché soddisfino le seguenti caratteristiche di qualità: rappresentatività (rispetto alla popolazione a cui si intende riferirsi senza discriminazioni), identificabilità, bilanciamento, similarità, diversità, efficacia, rilevanza, tempestività, verificabilità, di provenienza conosciuta (ISO/IEC 5259-2 “Data quality measures” per le Machine learning). Per la Salute inoltre molte iniziative sulla qualità sono in corso a livello internazionale, europeo e nazionale. Un esempio di applicazione della qualità è l’UNI CEN ISO/TS 82304-2:2021 Health software - Part 2: Health and wellness apps - Quality and reliability.
 
I vari aspetti citati evidenziano la necessità di una governance apposita con il coordinamento legislativo, di processo, di prodotto e approccio tecnico che includa formazione, preparazione del management, nuovi processi e diffusione della qualità prodotto per l’utente finale. La governance dei dati dovrà garantire tra l’altro la trasparenza, la collaborazione degli stakeholder, le responsabilità sulle diverse aree della gestione dei dati.
 
La qualità nel mondo digitale è sostenuta dagli Enti di standardizzazione: ad esempio come accennato dall’ISO, CEN, UNI e UNINFO, Istituzioni come l’AgID (si veda cap. 4/5 del Piano Triennale e la Determinazione 68/2013 sulle banche dati di interesse nazionale), il Ministero delle Imprese e del made in Italy, l’intera Accademia. Gli stakeholder, utenti e i consumatori esigono la qualità dei dati orientata alla convergenza delle informazioni e dei servizi, alla sintonia dei sistemi informativi con il software, gli algoritmi, i principi etici applicati nella progettazione e nella valutazione e monitoring.
 
I sistemi di Intelligenza artificiale, imitazioni di capacità umane, per quanto possano apprendere ed auto-alimentarsi, non hanno però alle spalle la storia millenaria dell’umanità, i contesti affettivi ed esperienziali che gravitano attorno ai numeri, non hanno ancora potuto maturare la conoscenza che nell’uomo è maturata nei secoli passati. Per cui l’IA si limiterà a fare solo quello per cui è progettata dall’uomo, con perimetri precisi, con i dati preparati allo scopo, basata su regole e concetti recenti e sui dati affidati alla macchina dalle conoscenze degli uomini.


Partecipando da alcuni anni alle commissioni di ricerca dell’ISO, del CEN e dell’UNI si ricordano spesso le affinità dei tentativi automatici di imitare il pensiero umano, ricordando i tempi in cui lo statistico e filosofo Bruno de Finetti scrisse nel 1952 il saggio “Macchine che pensano (e che fanno pensare)”.

pasted-graphic-1

Oggi, alcuni ricercatori, non solo di corrente giapponese, aggiungono che è importante alzare la guardia per la presenza del fenomeno di “Macchine che si umanizzano e di essere umani che si macchinizzano”.


Occorre accelerare la realizzazione di realtà esperienziali e passare dalla teoria alla pratica, seguendo quanto scrisse Ruggero Bacone, nel 1250, quando affermò che “Senza l’esperienza nulla può essere conosciuto sufficientemente”

IMG_9843

come accennato nella tesi di laurea in Statistica sociale del 1975.

IMG_9847


L’esperienza include anche i dati e la capacità del loro uso appropriato per prendere decisioni corrette (nel settore della salute, del clima, dell’energia, dei trasporti intelligenti, dell’agricoltura, sostenibilità, della sicurezza, smart cities, ecc.). alimentando le macchine e i sistemi senza che l’uomo perda la sua competenza, supervisione e possibilità di intervento. Si dovranno fare celermente dei passi avanti, considerando i dati e le informazioni come un aspetto della conoscenza, da approfondire e riconoscere tra i diversi punti di vista:

1.     I vincoli: le Leggi (AI Act), i diritti umani, l’etica, i modelli di qualità (es. ISO 25010-ISO/UNI 25059 IA) e dei dati (es. ISO/UNI 25012-24, ISO 5259-2), le metodologie, la governance, gli impatti sociali, il monitoraggio della qualità in uso (ISO/IEC 25019), requisiti di qualità legali e tecnici;
2.
     Lo sviluppo: gestione dei sistemi che elaborano dati in Input, in Output valutando la qualità dei dati e del software, cybersecurity, classi di rischio e automatismi;
3.
     Le tecnologie: cloud, sistemi quantistici, reti neurali, gestione del linguaggio, modelli generativi, machine learning, robot, dispositivi, IOT, sensori, dispositivi, hardware, ecc.).
 
Infine, occorre traguardare l’equilibrio tra i valori del regolamento AI Act (Art 1: human-centric, health, safety, fundamental rights) e le esigenze dell’automazione. L’obiettivo è raggiungere i benefici voluti e la fiducia di committenti e utenti (trustworthiness, meta-modello della fiducia che include i principi etici) in armonia con gli Enti di supervisione e di intervento, affinché i dati progettati e validati per gli scopi specifici prefissati possano essere anche di aiuto alla comprensione dei cambiamenti in atto per supportare la qualità della vita di tutti noi.

Maggiori informazioni sono date nei corsi di formazione.


The importance of Data quality - Domenico Natale, member of CEN-CENELEC JTC 21 (AI), SC42 (AI), SC7 (Software Engineering), UNINFO-UNI.

Rome, 16 May 2024,  Palazzo Giustiniani, Sala Zuccheri

Pasted Graphic

Organized by AiSDeT, Pontificia Academia Pro Vita, Ecosistematelemedicina.it, Innovazione per l’Italia

I am honored to speak in this forum on data quality, increasingly important topic. The future of the world, I believe, will not be oil, but will depend on data. Data will be as important as water. Similar to water (which must be clean, uncontaminated, protected for our survival), data must have high quality to be reliable and not mislead us. When in 2003 ISO/UNI/UNINFO began international work to define the first ISO data standard, published in 2008 as ISO/IEC 25012 “Data quality model”, no one thought that this topic would become so relevant for all sectors of Industry and Public Administration, and for Artificial Intelligence itself seen today in the European context of the AI Act.

Why talk about data quality standards? Because standards play an important role in offering better products, harmonizing terms and processes, facilitating communication, enabling synergies, increasing the interoperability of systems and data exchange, with common semantics and shared metadata, contributing to the reduction of costs and accidents. 

One way, for example, to preserve data in their territorial origin is to systematically collect them with a bottom-up procedure that starts from municipalities, provinces, regions and reaches national and European levels with a certain gradualness, related to the size of the interested population, observing the data as they evolve over time so that they can guide in understanding the facts and perspectives. 

It should be considered that data is not a digital artefact, as software often is, but above all it represents the fact itself and the criterion of truth for each of its aspects. Data is therefore reality, the interpretable representation of what exists. They are the elements on which decisions, improvements and developments can be based. The data, which follows standard rules, is not a convention, but provides information and knowledge of reality.

Each of us expects data to satisfy as many of the following 15 quality characteristics (inherent and system-dependent) as possible. According to the standard model 25012, adopted nationally in 2014 as UNI CEI ISO/IEC 25012, the data must satisfy the following aspects: compliance with laws, must be confidential (GDPR), accurate i.e. truthful, updated, coherent, complete, credible ; furthermore, they must be constructed in ways accessible to people with disabilities (Law 4/2004), understandable, precise, efficient, traceable, available (Open data), portable from one system to another, secured to avoid their loss and allow the restoration. For artificial intelligence systems, these listed aspects are being enriched at an international and European level with further quality aspects relating to data groups (datasets) so that they satisfy the following quality characteristics: representativeness (with respect to the population for which it is intended refer without discrimination), identifiability, balance, similarity, diversity, effectiveness, relevance, timeliness, verifiability, of known provenance (ISO/IEC 5259-2 “Data quality measures” for Machine learning). Furthermore, for Health, many quality initiatives are underway at international, European and national levels. An example of a quality application is UNI CEN ISO/TS 82304-2:2021 Health software - Part 2: Health and wellness apps - Quality and reliability.

The various aspects mentioned highlight the need for specific governance with legislative, process, product and technical approach coordination that includes training, management preparation, new processes and dissemination of product quality for the end user. Data governance will have to guarantee, among other things, transparency, stakeholder collaboration and responsibilities in the different areas of data management. 

Quality in the digital world is supported by standardization bodies: for example, as mentioned by ISO, CEN, UNI and UNINFO, institutions such as AgID (see chapter 4/5 of the Three-Year Plan and Determination 68/2013 on banks data of national interest), the Ministry of Business and Made in Italy, the entire Academy. Stakeholders, users and consumers demand data quality oriented towards the convergence of information and services, the harmony of information systems with software, algorithms, ethical principles applied in planning, evaluation and monitoring.
 

Artificial Intelligence systems, imitations of human abilities, although they can learn and self-feed, do not have the thousand-year history of humanity behind them, the affective and experiential contexts that gravitate around numbers, have not yet been able to develop knowledge which in man has matured in past centuries. Therefore AI will limit itself to doing only what it is designed for by man, with precise perimeters, with data prepared for the purpose, based on recent rules and concepts and on data entrusted to the machine by human knowledge. 

Having participated for some years in the research commissions of ISO, CEN and UNI, we often remember the affinities of automatic attempts to imitate human thought, recalling the times in which the statistician and philosopher Bruno de Finetti wrote in 1952 the following essay

pasted-graphic-1

" Machines that think and make you think." 


Today, some researchers, not only Japanese ones, add that it is important to raise our guard due to the presence of the phenomenon of "Machines that humanize themselves and human beings that machinize themselves". It is necessary to accelerate the realization of experiential realities and move from theory to practice, following what Roger Bacon wrote in 1250, when he stated that

IMG_9843

"Without experience nothing can be sufficiently known", as mentioned in Chapter 1 Natale's degree thesis in Social Statistics in 1975.

IMG_9847

"Without experience nothing can be sufficiently known", reported in one of the many gardens of Oxford University. The experience is the direct knowledge that a man can acquire of the phenomena that occur within him and outside of him. Scientific experience comes from the minute observation of the facts, from their interpretation, in relationship with and development to all sciences and previous experiences.

Experience also includes data and the ability to use it appropriately to make good decisions (in the fields of health, climate, energy, intelligent transport, agriculture, sustainability, security, smart cities, etc.) . powering the machines and systems without humans losing their competence, supervision and possibility of intervention. Progress must be made quickly, considering data and information as an aspect of knowledge, to be explored and recognized from different points of view: 

1. Constraints : laws (AI Act), human rights, ethics , quality models (e.g. ISO 25010-ISO/UNI 25059 IA) and data (e.g. ISO/UNI 25012-24, ISO 5259-2), methodologies, governance, social impacts, quality monitoring in use (ISO/IEC 25019), legal and technical quality requirements; 

2. 
Development : management of systems that process input and output data evaluating the quality of the data and software, cybersecurity, risk classes and automation; 

3. 
Technologies : cloud, quantum systems, neural networks, language management, generative models, machine learning , robots, devices, IOT, sensors, devices, hardware, etc..

Finally, it is necessary to achieve the balance between the values of the AI Act regulation (Art 1: human-centric, health, safety, fundamental rights) and the needs of automation. The objective is to achieve the desired benefits and the trust of clients and users (trustworthiness, Including ethical principles) in harmony with the supervisory and intervention bodies, so that the data designed and validated for the specific purposes set can also be of help in understanding the changes in designed to support the quality of life for all of us. 
 
More information is given in the training courses 

For the terms of Privacy and Cookies, please refer to Shinystat's general information

Per i termini di Privacy e Cookies si rinvia alla informativa generale di Shinystat




RapidWeaver Icon

Made in RapidWeaver