The SAIL Databank team have over 10 years’ experience of producing pre-linked datasets according to researchers’ requirements opening the doors to all researchers regardless of their own level of data linkage experience to use SAIL Databank as part of their important research.
Data Linkage has enormous potential for uncovering new areas of research with impact.
An NHS Trusted Third Party (TTP) Partner
The NHS Wales Informatics Service (NWIS) operate as a trusted third party (TTP) to anonymise records and then match these records with non-personal event information that’s used for research. At NWIS, any personal information and the NHS number where present, are removed and replaced with an Anonymous Linking Field (ALF). This is an encrypted number unique to each person represented in the dataset, with no attributable meaning or currency outside the system.
NWIS maintains the Welsh Demographic Service register which acts as a proxy for a Welsh population demographic database and is used to match the ALFs with any corresponding non-identifiable data.
Reliable record matching is important to preserve record integrity and identity in the anonymised datasets in the SAIL Databank. Without this, the validity of subsequent research would be in serious question. The matching algorithm was devised at NWIS and we were able to make use of this for data coming to the Databank.
At SAIL Databank we re-encrypt the ALF to make it double encrypted (ALF-E). This ensures that neither we nor NWIS can reverse engineer the anonymisation process to reveal identities.
More detailed information about privacy, anonymisation and record matching can be found here on our Data Privacy and Security pages.
Benefits of Data Linkage
Access to extensive population data
The ability to link multiple sources of data together that relate to e.g. a particular individual, a geographical location or an event, brings a new dimension to answering research questions. Data linkage allows researchers to use existing collections of extensive data that have been routinely collected and stored securely to identify patterns across entire populations to give a much broader picture.
Increase your depth of understanding
Previously unnoticed relationships can be identified giving greater depth of clarity and understanding that wouldn’t otherwise be possible from analysis using a single source of data alone.
Efficient and cost effective resource
Using existing data is far more cost effective than having to collect the equivalent data through other methods such as surveys, and is overall far less intrusive. This makes many research projects more feasible and an increase in research activities leads to greater health and wellbeing for populations, improvements in the provision of services and care, and helps to form policy at the highest level.
Use high quality research data
In addition, the quality of research data is improved to produce greater accuracy as the Quality Assurance process of linking data can identify and eliminate anomalies such as duplicate records that can otherwise affect the results of a study.
Open up new research opportunities
Linking together existing data gives endless opportunities to research areas of interest that may not have been previously possible. It allows more sophisticated research questions to be tackled to give a greater depth of understanding.
Mae gan dîm Banc Data SAIL dros 10 mlynedd o brofiad o gynhyrchu setiau data wedi’u rhag-gysylltu yn ôl gofynion ymchwilwyr gan agor y drysau i bob ymchwilydd waeth beth yw eu lefel eu hunain o brofiad ynghylch cysylltu data i ddefnyddio Banc Data SAIL fel rhan o’u hymchwil bwysig.
Mae gan Gysylltiadau Data botensial anferth i ddatgelu meysydd ymchwil newydd ag effaith.
Partner Trydydd Parti Dibynadwy i'r GIG
Mae Gwasanaeth Gwybodeg GIG Cymru (NWIS) yn gweithredu fel trydydd parti dibynadwy er mwyn gwneud cofnodion yn ddienw ac yna weddu'r cofnodion hyn i wybodaeth amhersonol am ddigwyddiadau a ddefnyddir ar gyfer ymchwil.Yn y Gwasanaeth, maent yn cael gwared ar wybodaeth bersonol a'r rhif GIG os bydd yno, a rhoi Maes Cysylltu Di-enw yn eu lle.Rhif wedi'i amgryptio yw hwn, sy'n unigryw i bob person yn y set ddata, heb ystyr na gwerth y gellir eu priodoli y tu allan i'r system.
Mae Gwasanaeth NWIS yn cynnal cofrestr Gwasanaeth Demograffig Cymru sy'n gweithredu yn lle cronfa ddata ddemograffig o boblogaeth Cymru, ac fe'i defnyddir er mwyn gweddu'r Meysydd Cysylltu Di-enw i ddata cyfatebol na ellir adnabod neb ohono.
Mae gweddu cofnodion yn ddibynadwy yn bwysig er mwyn cynnal cywirdeb cofnodion a chywirdeb y setiau data dienw ym Manc Data SAIL.Heb hyn, byddai amheuaeth fawr ynghylch dilysrwydd gwaith ymchwil dilynol.Dyfeisiwyd yr algorithm gweddu yn y Gwasanaeth, ac roeddem yn gallu defnyddio hwn ar gyfer data a oedd yn cyrraedd y Banc Data.
Ym Manc Data SAIL, rydym yn ailamgrymtio'r Maes Cysylltu Di-enw er mwyn ei wneud yn ddwbl-amgryptiedig (ALF-E),Mae hyn yn sicrhau na fyddwn ninnau na Gwasanaeth NWIS yn gallu ôl-droi'r broses anonymeiddio er mwyn datgelu hunaniaethau.
Ceir rhagor o fanylion am breifatrwydd, anonymeiddio a gweddu cofnodion yma ar ein tudalennau Preifatrwydd a Diogelwch Data.
Manteision Cysylltiadau Data
Mynediad i ddata helaeth ar y boblogaeth
Mae’r gallu i gysylltu ffynonellau lluosog o ddata â’i gilydd sy’n ymwneud ag e.e. unigolyn, lleoliad daearyddol neu ddigwyddiad penodol, yn cynnig dimensiwn newydd i ateb cwestiynau ymchwil. Mae cyswllt data’n caniatáu i ymchwilwyr ddefnyddio casgliadau sydd eisoes yn bodoli o ddata helaeth sydd wedi’i gasglu a’i storion ddiogel fel mater o drefn er mwyn nodi patrymau ar draws poblogaethau cyfan i roi darlun llawer ehangach.
Cynyddu dyfnder eich dealltwriaeth
Gellir nodi perthnasoedd na chafodd sylw’n flaenorol gan roi mwy o ddyfnder eglurder a dealltwriaeth na fyddai’n bosibl fel arall trwy ddadansoddi gan ddefnyddio un ffynhonnell o ddata’n unig.
Adnodd effeithlon a chost-effeithiol
Mae defnyddio data sydd eisoes yn bodoli yn llawer mwy cost effeithiol na gorfod casglu’r data cyfatebol trwy ddulliau eraill megis arolygon, ac yn gyffredinol, mae’n tarfu lawer llai. Mae hyn yn gwneud llawer o brosiectau ymchwil yn fwy ymarferol ac mae cynnydd mewn gweithgareddau ymchwil yn arwain at iechyd a lles gwell ar gyfer poblogaethau, gwelliannau yn y ddarpariaeth o wasanaethau a gofal, ac mae’n helpu i ffurfio polisi ar y lefel uchaf.
Defnyddio data ymchwil o ansawdd uchel
Yn ogystal, mae ansawdd data ymchwil yn cael ei wella i gynhyrchu mwy o gywirdeb gan y gall y broses Sicrhau Ansawdd o gysylltu data adnabod a dileu anomaleddau megis cofnodion dyblyg a all fel arall effeithio ar ganlyniadau astudiaeth.
Agor cyfleoedd ymchwil newydd
Mae cysylltu data presennol yn rhoi cyfleoedd diddiwedd i ymchwilio i feysydd diddordeb nad oedd wedi bod yn bosibl yn flaenorol efallai. Mae’n caniatáu mynd i’r afael â chwestiynau ymchwil mwy soffistigedig er mwyn rhoi mwy o ddyfnder i ddealltwriaeth.