მონაცემთა გაზიარება, კვლევის ეთიკა და [დარგის] მხარდაჭერა გაუმჯობესებას საჭიროებს.
გაგვიზიარეთ კომენტარები და უკუკავშირ
🌐 hypothes.is გამოყენებით
✨ თქვენი აზრი მნიშვნელოვანია ჩვენთვის!
კომპიუტერული სოციალური მეცნიერებების [Computational Social Science (CSS)] სფერო ბოლო ათწლეულის განმავლობაში მნიშვნელოვნად გაფართოვდა: გამოქვეყნდა ათასობით ნაშრომი, რომლებიც იყენებენ დაკვირვების მონაცემებს, ექსპერიმენტულ დიზაინებსა და ფართომასშტაბიან სიმულაციებს, რაც ადრე მკვლევრებისთვის მიუწვდომელი იყო. ამ კვლევებმა სოციალური ფენომენების შესახებ ჩვენი ცოდნა საგრძნობლად გააუმჯობესა, სოციალური უთანასწორობიდან ინფექციური დაავადებების გავრცელებამდე. ასევე, არსებითად გაიზარდა კომპიუტერული სოციალური მეცნიერებების მხარდამჭერი ინსტიტუციები აკადემიურ წრეებში, რასაც მოწმობს კონფერენციების, ვორქშოპებისა და საზაფხულო სკოლების მზარდი რაოდენობა მთელ მსოფლიოში. ამავდროულად, სფეროს გარშემო არსებული მრავალი ინსტიტუციური სტრუქტურა, მათ შორის კვლევის ეთიკა, სწავლება და მონაცემთა ინფრასტრუქტურა, ჯერ კიდევ ჩამოყალიბების სტადიაშია. ამ სტატიაში ჩვენ გთავაზობთ შესაძლებლობებს ამ საკითხების მოსაგვარებლად, განსაკუთრებით მე-20 საუკუნის უნივერსიტეტის ორგანიზაციასა და სფეროს ინტელექტუალურ მოთხოვნებს შორის არსებული შეუსაბამობის აღმოსაფხვრელად.
ჩვენ განვმარტავთ კსმ როგორც კომპიუტერული (გამოთვლითი) მეთოდების განვითარება და გამოყენება კომპლექსური, როგორც წესი მასშტაბური, ადამიანის ქცევითი (ზოგჯერ სიმულირებული) მონაცემებისთვის(Lazer et al. 2009). მის ინტელექტუალურ წინამორბედებს შორისაა ტექსტებისა და სურათების ხელით კოდირება1, სივრცითი მონაცემებისა და სოციალური ქსელების ანალიზი. რაოდენობრივი სოციალური მეცნიერებების ტრადიციული მეთოდები ფოკუსირებულია მწკრივებზე როგორც შემთხვევებზე და სვეტებზე როგორც ცვლადებზე. ეს მეთოდები ასევე ვარაუდობს, რომ დაკვირვების ერთეულები ერთმანეთისგან დამოუკიდებელია. მისგან განსხვავებით, კომპიუტერული სოციალური მეცნიერებები აერთიანებს ენას, ადგილმდებარეობას, ადგილმდებარეობას, ქსელებს, გამოსახულებებსა და ვიდეოს. ის იყენებს სტატისტიკურ მოდელებს, რომლებიც ასახავს მონაცემებში არსებული მრავალგვარი ურთიერთდამოკიდებულების სტრუქტურას. ამ სახელწოდების [კომპიუტერული სოციალური მეცნიერებები] ქვეშ გაერთიანებულია ჯერ კიდევ სუსტად დაკავშირებული აკადემიური საზოგადოება, რომელიც მოიცავს სოციალური მეცნიერებების, კომპიუტერული მეცნიერებების, სტატისტიკური ფიზიკისა და სხვა დარგების წარმომადგენლებს.
როგორც წესი, უნივერსიტეტების უმეტესობაში სტრუქტურა და წახალისების სისტემა არ არის მორგებული მსგავს მულტიდისციპლინურ დისციპლინას. სწავლა/სწავლება მიდრეკილია იზოლაციისკენ. კომპიუტერული [მეთოდების] სწავლების პირდაპირი ინტეგრაცია სოციალურ მეცნიერებებში (მაგ. სოციალური მეცნიერისთვის კოდის წერის სწავლება) და სოციალური მეცნიერებების ინტეგრაცია კომპიუტერულ დისციპლინებში (მაგ. კომპიუტერული მეცნიერისთვის კვლევის დიზაინის სწავლება) შენელებული ტემპებით მიმდინარეობს. კომპიუტერული [Computational] მკვლევრები და სოციალური მეცნიერები, როგორც წესი, უნივერსიტეტის მკვეთრად დაშორებულ კამპუსებში, სხვადასხვა დამოუკიდებელ სტრუქტურულ ერთეულში მუშაობენ და მათი თანამშრომლობის წახალისების ძალიან ცოტა მექანიზმი არსებობს. დეცენტრალიზებული საბიუჯეტო მოდელები ხელს უშლის კოორდინირებულ მუშაობას და ხშირად იწვევს არაეფექტური ხარჯების დუბლირებას.
კვლევის შეფასების პროცედურები, მაგალითად, დიდი ბრიტანეთის კვლევის ბრწყინვალების ჩარჩო (Research Excellence Framework), რომელიც კვლევებს აფინანსებს, როგორც წესი, ფოკუსირებულია დისციპლინების შიგნით, რაც ნიშნავს, რომ მულტიდისციპლინური კვლევა შეიძლება ნაკლებად იყოს აღიარებული და დაფასებული. ანალოგიურად, უნივერსიტეტის დაწინაურების პროცედურები, როგორც წესი, ნაკლებად მიდრეკილია მულტიდისციპლინური გამოცდილების მეცნიერების წახალისებისკენ. უნივერსიტეტების კომპიუტერული (გამოთვლითი) კვლევის ინფრასტრუქტურა ხშირად ვერ აკმაყოფილებს ფართომასშტაბიანი, სენსიტიური პერსონალური მონაცემების2 შემცველი ბაზების უსაფრთხოებისთვის, გამოთვლის სიმძლავრისა და დიდი რაოდენობის მკვლევრების ხელმისაწვდომობის მოთხოვნებს. მაშინ როცა ეს საკითხები აკადემიაში ნაწილობრივ გადაჭრილია (მაგ. გენომის მონაცემების შემთხვევაში), კომპიუტერულ სოციალურ მეცნიერებებში ეს გამოცდილება სრულად არ არის დანერგილი.
ამჟამინდელი პარადიგმები იმ ფართომასშტაბიანი და სენსიტიური მონაცემების გაზიარებისთვის, რომლებიც კომპიუტერულ სოციალურ მეცნიერებებში გამოიყენება, წინააღმდეგობრივ სურათს ქმნის. არსებობს მთავრობასთან თანამშრომლობის წარმატებული მაგალითები, განსაკუთრებით ეკონომიკაში, მათ შორის უთანასწორობისა(Chetty et al. 2014) და დასაქმების ბაზრის დინამიკის(Abowd, Haltiwanger, and Lane 2004) შესწავლის კვლევებში. არსებობს ადმინისტრაციული მონაცემების კვლევითი ცენტრების ახალი, რესურსებით კარგად გამყარებული მოდელები, რომლებიც მიკროდონეზე მონაცემთა ანალიზის პლატფორმებს წარმოადგენენ პერსონალური მონაცემების დაცვით(Reamer and Lane 2018). აღნიშნული შემთხვევები მნიშვნელოვანია სამომავლო თანამშრომლობისთვის კერძო ორგანიზაციებთან. განსაკუთრებით მნიშვნელოვანია ისეთი მეთოდოლოგიის შექმნა, რომელიც ერთდროულად უზრუნველყოფს სენსიტიური პერსონალური მონაცემების დაცვასა და მათ ხელმისაწვდომობას ანალიზისთვის (მაგ. ინოვაციური გადაწყვეტების შექმნა დიფერენციალური პერსონალური მონაცემთა დაცვის, მიმართულებით).
კერძო კომპანიების პოზიციონირება განსხვავებულია და, როგორც მოსალოდნელი იყო, ამ სექტორში ნაკლები პროგრესია. სამთავრობო ინსტიტუტები ამუშავებენ მონაცემებს საზოგადოების სასიკეთოდ, ხოლო კომპანიის ხელთ არსებული მონაცემები, განიხილება როგორც ინტელექტუალური საკუთრება და ეკონომიკური აქტივი. დაინტერესებული მხარეები სამთავრობო უწყებების საჯარო ანგარიშვალდებულებას, რომელიც გამოიხატება მონაცემთა გაზიარებაში, დადებითად აფასებენ, მაგრამ, კერძო კომპანიების აქციონერებისგან ასეთი დამოკიდებულება ნაკლებად მოსალოდნელია. ამგვარად, აკადემიისთვის კერძო კომპანიების მონაცემები იშვიათად არის ხელმისაწვდომი, ხოლო როდესაც ხელმისაწვდომია, როგორც წესი, მონაცემებზე წვდომა შეზღუდული და ფრაგმენტული ხასიათისაა: მონაცემების მხოლოდ ნაწილი ხელმისაწვდომია აპლიკაციის პროგრამირების ინტერფეისით (API). მეშვეობით, ან მონაცემები ხელმისაწვდომია მხოლოდ კომპანიასთან პირდაპირი თანამშრომლობით (ხშირად კომპანიაში ფიზიკური ყოფნის საჭიროებით). აღნიშნულის გარდა, მონაცემებზე წვდომა, ასვე ხდება პერსონალური კავშირებისა და ერთჯერადი შეთანხმებების საშუალებით, რომლებიც ხშირად რეგულირდება გაუთქმელობის ხელშეკრულებით და ექვემდებარება პოტენციურ ინტერესთა კონფლიქტს. მონაცემების ხელმისაწვდომობის ალტერნატიული გზაა მარკეტინგული კვლევებისთვის შეგროვებული კერძო მონაცემების (მაგ. Comscore, Nielsen) გამოყენება, თუმცა ამ კომპანიების მეთოდოლოგია ხშირად გაუმჭვირვალეა, ხოლო მაღალი ღირებულება მკვლევრების უმრავლესობისთვის ნაკლებად ხელმისაწვდომს ხდის.
ჩვენ მიგვაჩნია, რომ ეს მიდგომა, როგორი პრაგმატულიც არ უნდა ჩანდეს ისეთ პირობებში, სადაც მსგავსი მონაცემები უხვად არსებობს და ჩამოყალიბების ეტაპზე მყოფი კვლევითი საზოგადოებისთვის რესურსები შეზღუდულია, ვეღარ უნდა დარჩეს კომპიუტერული სოციალური მეცნიერებების საფუძვლად. ჩვენ გამოვყოფთ მონაცემთა ხელმისაწვდომობისა და მათზე წვდომის ორ ძირითად პრობლემას.
პირველი, ბევრი კომპანია თანდათანობით ამცირებს მონაცემებს, რომელთა შეგროვება შესაძლებელია მათი პლატფორმებიდან(Freelon 2018). ეს ზოგჯერ გამართლებული მიზეზით ხდება, მაგალითად, საკანონმდებლო ვალდებულებების (მაგ., ევროკავშირის მონაცემთა დაცვის ზოგადი რეგულაცია) ან კორპორაციული სკანდალის (Cambridge Analytica და Facebook) გამო. თუმცა, აღნიშნულის გვერდითი ეფექტი შეიძლება იყოს პოტენციურად ღირებული კვლევის განხორციელებისთვის გზების გადაჭრა. მონაცემთა ხელმისაწვდომობის თვითნებური და არაპროგნოზირებადი ცვალებადობის ხასიათი კერძო სექტორში, რომლის მეცნიერებთან თანამშრომლობის მხოლოდ ნებაყოფლობითია, ამ სისტემას მეცნიერებისთვის არსებითად არასანდოსა და პოტენციურად მიკერძოებულს ხდის.
მეორე, მომხმარებელთა პროდუქტებისა და პლატფორმების მიერ გენერირებული მონაცემები არ არის სრულყოფილად მორგებული კვლევითი მიზნებზე(Salganik 2019)4. ონლაინ პლატფორმებისა და სერვისების მომხმარებლების ერთობლიობა შეიძლება არ იყოს მოსახლეობის რეპრეზენტატული, ხოლო მათი ქცევა შეიძლება იყოს მიკერძოებული გაურკვეველი მიზეზების გამო.
იმის გამო, რომ პლატფორმები არ შექმნილა კვლევით კითხვებზე პასუხების გასაცემად, ამ თვალსაზრისით ყველაზე მნიშვნელოვანი მონაცემები, შესაძლოა, არ იყოს შეგროვებული (მაგ., მკვლევრები, რომლებიც დაინტერესებულნი არიან ინფორმაციის გავრცელებით, ითვლიან რეტვიტებს, რადგან ეს არის მხოლოდ ის, რაც აღირიცხება), ან შეიძლება შეგროვდეს ისეთი გზით, რომელიც გადაფარულია სისტემის სხვა ელემენტებით (მაგ., დასკვნები მომხმარებელთა პრეფერენციების შესახებ გადაფარულია კომპანიის რანჟირებისა და რეკომენდაციის ალგორითმების გავლენით). პლატფორმების დიზაინი, ფუნქციები, მონაცემთა ჩაწერა და მონაცემებზე წვდომის სტრატეგია შეიძლება ნებისმიერ დროს შეიცვალოს, რადგან პლატფორმის მფლობელები არ არიან დაინტერესებული, შეინარჩუნონ ინსტრუმენტების თავსებადობა კვლევით მიზნებთან.
აღნიშნული მიზეზების გამო, ასეთი “ნაპოვნი” მონაცემების საფუძველზე განხორციელებული კვლევის შიდა და გარე ვალიდობა გარდაუვალად იწვევს ეჭვებს. ასევე, პლატფორმაზე [მომხმარებლის ქცევის ჩანაწერები] შექმნილი მონაცემების მნიშვნელობა პლატფორმების ცვლილებასთან ერთად შეიძლება სწრაფ გაუფასურდეს(Munger 2019). გარდა ამისა, ნედლი მონაცემები, პირადი ცხოვრების ხელშეუხებლობისა და ინტელექტუალური საკუთრების დაცვის მიზეზით, ხშირად მიუწვდომელია სამეცნიერო საზოგადოებისთვის, ან შეიძლება მომავალში გახდეს ხელმიუწვდომელი, რაც ხელს უშლის შედეგების რეპროდუცირებასა და რეპლიკაციას.
დაბოლოს, ვერ მოხერხდა სამეცნიერო კვლევის შეთანხმებული “თამაშის წესების”5 ჩამოყალიბება. მიუხედავად მოწოდებებისა ასეთი სახელმძღვანელო პრინციპების შესამუშავებლად, დაფიქსირდა მნიშვნელოვანი ჩავარდნები, რომლებმაც კსმ-ის მიმართ საზოგადოების ნდობა შეარყია. დარგმა ვერ შეძლო ადამიანების შესახებ ციფრული მონაცემების შეგროვებისა და ანალიზისთვის ისეთი მკაფიო პრინციპებისა და მექანიზმების სრულად ჩამოყალიბება, რომელიცმინიმუმამდე შეამცირებდა პოტენციურ ზიანს. უნივერსიტეტების მხოლოდ მცირე რაოდენობა უზრუნველყოფს ტექნიკურ, იურიდიულ, მარეგულირებელ ან ეთიკურ სახელმძღვანელოებს სენსიტიური მონაცემების სათანადოდ შესანახად და სამართავად. ინსტიტუციური ეთიკის საბჭოების რეაგირება, როგორც წესი, კვლავაც არ არის მორგებული ციფრული კვალის მონაცემებთან დაკავშირებულ სპეციფიკურ ეთიკურ გამოწვევებზე. შეერთებულ შტატებში Common Rule-ის უახლესმა მოდიფიკაციამ, რომელიც ეხება ადამიანთა კვლევის ეთიკას, სრულად ვერ გადაჭრა ეს პრობლემები.
მაგალითად, ქსელურ სამყაროში6, როგორ უნდა გავუმკლავდეთ იმ ფაქტს, რომ საკუთარი თავის შესახებ ინფორმაციის გაზიარება არსებითად იძლევა ინფორმაციას იმათ შესახებ, ვისთანაც დაკავშირებული ვართ? თანხმობის7 გარშემო არსებული გამოწვევები ხაზს უსვამს სენსიტიური მონაცემების უსაფრთხოების მართვის მნიშვნელობას და ასევე ინსტიტუციური მიმოხილვის პროცესებისა და ეთიკური ნორმების ხელახალი გააზრების აუცილებლობას; თუმცა, უნივერსიტეტების მცირე რაოდენობა ავითარებს ინფრასტრუქტურასა და ზედამხედველობის პროცესებს უსაფრთხოების ხარვეზების რისკების მინიმუმამდე შესამცირებლად.
კემბრიჯ ანალიტიკას სკანდალმა და სხვა, მსგავსმა მოვლენებმა, გამოიწვია გაცხარებული დებატები მონაცემთა სუვერენიტეტის გარშემო. ბრძოლის ხაზი გაივლო პირადი ცხოვრების ხელშეუხებლობის დამცველებსა და კომპანიებს შორის, რომელთაგან პირველნი ცდილობენ, მინიმუმამდე დაიყვანონ ყველა მონაცემის შეგროვება და ანალიზი, ხოლო უკანასკნელნი ცდილობენ, გაამართლონ მონაცემთა შეგროვების სტრატეგიები მომხმარებლებისთვის სარგებლიანობის საფუძვლით.
საჯარო დებატებში ნაკლებად ისმის პოზიციები იმ პოლიტიკის სასარგებლოდ, რომელიც წაახალისებდა ან სავალდებულოს გახდიდა კერძო მონაცემების ეთიკურ გამოყენებას, რომელიც შესაბამისობაში იქნებოდა ისეთ საჯარო ღირებულებებთან, როგორიცაა პირადი ცხოვრების ხელშეუხებლობა, ავტონომია, უსაფრთხოება, ადამიანის ღირსება, სამართლიანობა და ძალაუფლების ბალანსი მნიშვნელოვანი საჯარო მიზნების მისაღწევად -იქნება ეს დაავადებების გავრცელების პროგნოზირება, თანასწორობისა და ხელმისაწვდომობის შესახებ საზოგადოებრივი საკითხების წარმოჩენა, თუ ეკონომიკის კოლაფსი. ასევე, ხშირად არის ინვესტიციების ნაკლებობა აკადემიურ სფეროში არსებულ ინფრასტრუქტურაში, რომელიც შეძლებდა ცოდნის წარმოებას და პირადი ცხოვრების ხელშეუხებლობის შენარჩუნებას.
აღნიშნულ გამოწვევებზე საპასუხოდ, ჩვენ გთავაზობთ ხუთ რეკომენდაციას.
ზემოთ აღნიშნული შეზღუდვების მიუხედავად, კერძო კომპანიების მიერ შეგროვებული მონაცემები მეტისმეტად მნიშვნელოვანია, საკმაოდ ძვირია მათი შეგროვება სხვა საშუალებებით და იმდენად ყოვლისმომცველია, რომ საზოგადოებისთვის დახურული და საჯაროდ დაფინანსებული კვლევისთვის ხელმიუწვდომელი არ უნდა დარჩეს(Social Science Research Council (SSRC) 2018). კერძო სექტორთან თანამშრომლობის თავიდან არიდების ნაცვლად, კვლევითმა საზოგადოებამ უნდა შეიმუშაოს აღსრულებადი სახელმძღვანელო პრინციპები კვლევის ეთიკის, გამჭვირვალობის, მკვლევართა ავტონომიისა და კვლევების რეპლიკაციის შესახებ. ჩვენ ვვარაუდობთ, რომ მომდევნო წლებში გაჩნდება მრავალი ისეთი მიდგომა, რომელიც წახალისების თვალსაზრისით შესაბამისი და მისაღები იქნება დაინტერესებული მხარეებისთვის.
ყველაზე ფართოდ გავრცელებული და დროში გამოცდილი მოდელი არის ღია, აგრეგირებული მონაცემები, როგორიცაა საყოველთაო აღწერის მონაცემები. ეს მოდელები, რომლებიც უსაფრთხოებისა და პირადი ცხოვრების ხელშეუხებლობის პრინციპებთან შესაბამისობაში შემუშავდა სამთავრობო მონაცემების გასაზიარებლად , იმედისმომცემია კერძო სექტორის მონაცემებთან მუშაობითვისაც. გაერთიანებული ერების მდგრადი განვითარების მიზნები მოუწოდებს მონაცემთა წყაროების საჯარო-კერძო ორგანიზაციებს ურთიერთპარტნიორობისკენ, რათა უზრუნველყონ ახალი, მდიდარი, მრავალფეროვანი საზომების ფართო სპექტრის შექმნა, თითოეული კუთხე-კუნჭულისთვის8, მთელ მსოფლიოში(IEAG, UN 2015). სტატისტიკის ეროვნული სამსახურები, მსოფლიოს ყველა კუთხეში, შეუმჩნევლად მუშაობენ ასეთი პროდუქტების შესაქმნელად, თუმცა დაფინანსების ნაკლებობის გამო პროგრესი ნელია. უსაფრთხო, ადმინისტრაციული ინფრასტრუქტურით მხარდაჭერილი, ადმინისტრაციული მონაცემთა ცენტრების განვითარება, რომლებიც უზრუნველყოფენ [მონაცემებზე] წვდომისა და შედეგების მონიტორინგს პირადი ცხოვრების ხელშეუხებლობისა და ეთიკის წესების დაცვით, მომავლის ერთ-ერთ მოდელს წარმოადგენს. როგორც ზემოთ აღინიშნა, ეს მოდელი უკვე მუშაობს საჯარო სექტორში; ასევე, არის რამდენიმე წარმატებული შემთხვევა სატელეკომუნიკაციო და საბანკო სფეროებში.
აკადემიური კვლევისთვის მსგავსი მოდელები იშვიათია,თუმცა, ბოლო პერიოდში, მისი უფრო მეტი და მეტი მაგალითები გვხვდება. ორგანიზაცია სოციალური მეცნიერებისა და ეკონომიკური ინოვაციების ღია მონაცემთა ინფრასტრუქტურა (ODISSEI) ნიდერლანდებში ამის ერთ-ერთი მაგალითია. Facebook-მა მეცნიერებთან თანამშრომლობის სხვადასხვა მოდელი გამოცადა. განვითარებისადრეულ წლებში, ის ფოკუსირებული იყო ერთჯერად თანამშრომლობებზე, რომლებსაც ძირითადად არაფორმალური შეთანხმებები ედო საფუძვლად. 2016 წლის არჩევნების შემდეგ9, Facebook-ის მხარდაჭერით დაიწყო ფუნქციონირება ორგანიზაციამ Social Science One, რომელიც უზრუნველყოფდა წვდომას ახალი ამბების მოხმარების აგრეგირებულ მონაცემებზე, რომელიც, მიუხედავად კარგი რესურსებით უზრუნველყოფისა, მონაცემების მიწოდებაში გამოწვევებს წააწყდა(King and Persily 2019).
კორონავირუსის პანდემიამ (COVID-19) განსაკუთრებული როლი ითამაშა მკვლევრებსა და კომპანიებს შორის პარტნიორობის ჩამოყალიბებაში, იმ მიზნით, რომ დაავადების ტრაექტორიის სიღრმისეული ანალიზი მომხდარიყო. (COVID-19-მა, მრავალ ქვეყანაში, მათ შორის ამერიკის შეერთებულ შტატებში, ასევე წარმოაჩინა დაავადების შესახებ საჯარო მონაცემების დანაწევრებული და პოლიტიკურად დამოკიდებული ბუნება). Twitter-მა10 წინასწარ შერჩეული მკვლევრებისთვის უზრუნველყო API სტრიმინგი COVID-19-ის შესახებ. ამის მსგავსად, ადგილმდებარეობის მონაცემების კომპანიებმა, როგორიცაა Cuebiq, უზრუნველყვეს წვდომა გადაადგილების ანონიმიზებულ მონაცემებზე. ღია კითხვად რჩება, რამდენად გაგრძელდება მონაცემთა გაზიარების ეს ძალისხმევა დაავადების ისტორიაში შესვლის შემდეგ, და თუ გაგრძელდება, როგორ მოხდეს მათი საიმედოდ შეთავსება აკადემიის კრიტიკულ კვლევის ნორმებთან, როგორიცაა გამჭვირვალობა, წარმოებადობა, რეპლიკაცია და თანხმობა.
Facebook-თან დაკავშირებული არჩევნების მაგალითები ხაზს უსვამს პოტენციურად დაპირისპირებულ როლს მკვლევრებსა და კორპორაციებს შორის. კომპიუტერული სოციალური მეცნიერებების სფეროსთვის ცენტრალური თანამედროვე კითხვაა (როგორც ქვემოთ განვიხილავთ), თუ რა გზებით ასრულებენ კონკრეტული სოციოტექნიკური სისტემები დადებით და უარყოფით როლებს საზოგადოებაში. ეს დაძაბულობა ნაწილობრივ (მაგრამ არა სრულად) შეიძლება გადაიჭრას, თუ კომპანიები იგრძნობენ, რომ მათი გრძელვადიანი ინტერესია, გამჭვირვალედ შეისწავლონ და წინასწარ განჭვრიტონ ეს საკითხები. თუმცა, ყველაზე ოპტიმისტურ სცენარშიც კი, მაინც იქნება განსხვავება საჯარო ინტერესს შორის იმ სიღრმისეულ ანალიზში, რაც კვლევამ შეიძლება მოიტანოს, და კერძო კომპანიის ინტერესებს შორის.
აკადემიურმა სფერომ, ზოგადად, პროფესიული პრაქტიკისთვის სახელმძღვანელო პრინციპები უნდა შეიმუშაოს. რა კონტროლი შეიძლება ჰქონდეთ კომპანიებს კვლევის პროცესზე? ცხადია, მიუღებელია, რომ კომპანიას ჰქონდეს ვეტოს უფლება სტატიის შინაარსზე; თუმცა, რეალურად, მონაცემთა გაზიარების ნებისმიერ შეთანხმებაში დადგენილია შესწავლის შეზღუდული ფარგლები. რა მოთხოვნებია რეპლიკაციის განხორციელებისთვის საჭირო მონაცემთა წვდომაზე? რა საჭიროებები აქვთ მკვლევრებს კომპანიის შიდა მონაცემთა მართვისა და პროცესებზე წვდომისთვის?
პირადი ცხოვრების ხელშეუხებლობის დაცვაზე ორიენტირებულ, საზიარო მონაცემთა ინფრასტრუქტურებს, რომლებიც საზოგადოებრივად მნიშვნელოვანი გამოწვევების შესახებ სამეცნიერო კვლევების მხარდასაჭერად არიან შექმნილნი, შეუძლიათ შეაგროვონ სამეცნიერო ინტერესებითშექმნილი მრავალფეროვანი პოპულაციების ციფრული ნაკვალევი მათივე ბუნებრივ გარემოში. ამასთანავე, მათ შეუძლიათ ინდივიდთა დიდი ჯგუფები ჩართონ ფართომასშტაბიან ვირტუალურ ლაბორატორიებში მოწყობილ ექსპერიმენტებში. ასეთი მონაცემთა ინფრასტრუქტურები შეიძლება, საჯარო ინტერესის მოტივით ან კონკრეტული კომპენსაციის სანაცვლოდ, მოქალაქეების მიერ შეწირულ მონაცემებს და/ან დროს ეფუძნებოდეს.
ასეთმა ინფრასტრუქტურებმა უნდა გამოიყენონ უსაფრთხოების ყველაზე თანამედროვე ზომები და მონაცემების სენსიტიურობის მიხედვით ეტაპობრივად მზარდი უსაფრთხოების ზომების სია (checklist) ეს ქმედებებიუნდა მოხდეს როგორც კონკრეტული უნივერსიტეტების, ისე უნივერსიტეტთაშორისდონეზე. საბოლოოდ, ამ ინფრასტრუქტურებმა უნდა მოიცვან და დოკუმენტირება გაუკეთონ მეტამონაცემებს, რომლებიც აღწერენ მონაცემთა შეგროვების პროცესს და ითვალისწინებენ მონაცემთა შეგროვებისა და გამოყენების ეთიკურ პრინციპებს. უსაფრთხო მონაცემთა ცენტრი GESIS Leibniz-ის ინსტიტუტში სოციალური მეცნიერებებისთვისარის სენსიტიურ მონაცემებზე კვლევის მიზნით გაზიარებული ინფრასტრუქტურის მაგალითი. გარდა ამისა, მნიშვნელოვანია ძირითადი პლატფორმებზე ალგორითმებით მართული ქცევის დროთა განმავლობაში აღრიცხვა (Rahwan et al. 2019; Hannak et al. 2013). ალგორითმული ქცევა სულ უფრო მნიშვნელოვანი ხდება; ალგორითმული ცვლილებები ქმნის უზარმაზარ არტეფაქტებს პლატფორმაზე დაფუძნებულ მონაცემთა შეგროვებაში. კრიტიკულად მნიშვნელოვანია, რომ სამართლებრივმა ჩარჩოებმა დაუშვას და სავალდებულო გახადოს ეთიკური მონაცემების წვდომა და შეგროვება ინდივიდების შესახებ და პლატფორმების მკაცრი აუდიტი.
ჩვენ გვჭირდება ეთიკური ჩარჩოების შემუშავება, რომლებიც შეესაბამება 21-ე საუკუნის სამეცნიერო შესაძლებლობებსა და ახალ რისკებს.
სოციალურ მეცნიერებებს შეუძლია, დაგვეხმაროს საზოგადოების სტრუქტურული უთანასწორობის გაგებაში, და კომპიუტერულ სოციალურ მეცნიერებებს სჭირდება მონაცემებზე დაფუძნებული ალგორითმების შავი ყუთის გახსნა, რომლებიც იღებენ მრავალ მნიშვნელოვან გადაწყვეტილებას, მაგრამ რომლებშიც შეიძლება ასევე ჩაშენებული იყოს სისტემური შეცდომები(Obermeyer et al. 2019). ადამიანის გენომის პროექტმა ეთიკური, სამართლებრივი და სოციალური შედეგების პროგრამის ფარგლებში 300 მილიონზე მეტი დოლარი გამოყო “იმის უზრუნველსაყოფად, რომ საზოგადოებამ ისწავლოს ამ ინფორმაციის მხოლოდ სასარგებლო გზებით გამოყენება”(McEwen et al. 2014). აარ არსებობს მზა რეცეპტები კვლევის ეთიკურად განხორციელებისთვის. პროფესიულმა ასოციაციებმა უნდა იმუშაონ ახალი ეთიკური სახელმძღვანელო პრინციპების შემუშავებაზე. ასეთი ერთი კარგი მაგალითია ინტერნეტ-მკვლევართა ასოციაციის მიერ შემუშავებული სახელმძღვანელო პრინციპები. მათი ინიციატივა საკითხის ნაწილობრივ გადაწყვეტას ემსახურება. საჭიროა დიდი ინვესტიციები, როგორც საჯარო სექტორიდან, ასევე კერძო ფონდების მხრიდან, რათა შემუშავდეს ინფორმირებული მარეგულირებელი ჩარჩოები და ეთიკის სახელმძღვანელო პრინციპები მკვლევრებისთვის, რათა სამთავრობო და კერძო სექტორებმა შესაბამისი სტანდარტების დაცვით იმუშაონ.
კომპიუტერული დამუშავება სულ უფრო მეტ სფეროს უახლოვდება — ასტრონომიიდან დაწყებული, ჰუმანიტარული მეცნიერებებით დამთავრებული. საჭიროა ინოვაციები აქამდე იზოლირებული უნივერსიტეტების ორგანიზაციაში, რათა ეს აისახოს, ისეთი სტრუქტურების განვითარებაში, რომლებიც აკავშირებს მრავალფეროვან მკვლევრებს და სადაც სხვადასხვა სფეროს შორის თანამშრომლობა პროფესიულად წახალისებულია. ინსტიტუციური პრაქტიკის წარმატებული მაგალითები მოიცავს მრავალ განყოფილებასთან აფილირებული პროფესორ-მასწავლებლების დანიშვნას (მაგ., კომპიუტერულ მეცნიერებასა და სოციალურ მეცნიერებებს შორის), ისეთი კვლევითი ცენტრების შექმნას, რომლებიც ფიზიკურად აერთიანებს სხვადასხვა დარგის აკადემიურ პერსონალს, და შიდა დაფინანსების გამოყოფას მულტიდისციპლინური თანამშრომლობის მხარდასაჭერად. საჭიროა ფუნდამენტური გადააზრება ბაკალავრიატისა და მაგისტრატურის სასწავლო პროგრამების განვითარებაში მეცნიერთა ახალი თაობის მოსამზადებლად. უნივერსიტეტში უნდა იყოს ყოვლისმომცველი ძალისხმევა ეთიკური კვლევითი პრაქტიკის გასაძლიერებლად და დასანერგად, , რისი ერთ-ერთი მაგალითიცაა ცენტრალურად კოორდინირებული, უსაფრთხო მონაცემთა ინფრასტრუქტურები.
ზემოდასახელებული რეკომენდაციების განხორციელებისთვის საჭიროა, როგორც საჯარო, ასევე კერძო სექტორის რესურსების გაერთიანება. მიმდინარე მდგომარეობის გათვალისწინებით, დაფინანსების ასეთი სქემა უჩვეულოა სოციალური მეცნიერებებისთვის. იმისათვის, რომ დასაბუთდეს მსგავსი უპრეცედენტო ინვესტიცია, კომპიუტერული სოციალური მეცნიერების მკვლევრებმა უნდა დაასაბუთონ, რომ შედეგი იქნება მეტი, ვიდრე მხოლოდ სამეცნიერო ჟურნალებში სტატიების გამოქვეყნება, რომლებიც ძირითადად სხვა მკვლევრებისთვის არის საინტერესო. მათ უნდა დაასაბუთონ, თუ როგორ შეუძლია აკადემიის, ინდუსტრიის და საჯარო სექტორის თანამშრომლობასა და სამეცნიერო ინფრასტრუქტურის კომბინაციას საზოგადოებისთვის მნიშვნელოვანი ისეთი პრობლემების გადაჭრა, როგორიცაა სიცოცხლის გადარჩენა, ეროვნული უსაფრთხოების გაუმჯობესება, ეკონომიკური კეთილდღეობის გაძლიერება, ინკლუზიის, მრავალფეროვნების, თანასწორობისა და ხელმისაწვდომობის ხელშეწყობა, დემოკრატიის განმტკიცება და ა.შ. პანდემიაზე გლობალური რეაგირების პროცესში კომპიუტერული სოციალური მეცნიერების გამოყენება სიმბოლურად წარმოაჩენს ამ დარგის უფრო ფართო პოტენციალს. აკადემიის გარეთ მნიშვნელოვანი შედეგების გენერირების გარდა, ამ მიზნის მიღწევამ შესაძლოა, ასევე რეპლიკაციის უნარის მქონე, დაგროვებით და თანმიმდევრულ მეცნიერებამდე მიგვიყვანოს(Watts 2017).
შავი ზღვის საერთაშორისო უნივერსიტეტის სამართლისა და სახელმწიფო მმართველობის სკოლის სტუდენტები კვლევის მეთოდების კურსის ფარგლებში სტატიის თარგმანს გაეცნენ და გააზიარეს უკუკავშირი - სალომე ლომიძე, ლია ვანიანი, მარიამ ხიჩაკაძე, ნინო ბოლქვაძე, მარიამ ჩანქსელიანი, გიორგი ჭულუხაძე, რუსკა ხულელიძე, მარიამ შეყრილაძე, მაკა ყაჭიური, ლალიკო ავიაზაშვილი, მარიამ პერტაია.
David M. J. Lazer, Alex Pentland, Duncan J. Watts, Sinan Aral, Susan Athey, Noshir Contractor, Deen Freelon, Sandra Gonzalez-Bailon, Gary King, Helen Margetts, Alondra Nelson, Matthew J. Salganik, Markus Strohmaier, Alessandro Vespignani and Claudia Wagner
David M. J. Lazer et al. , (2020). Computational social science: Obstacles and opportunities. Science369,1060-1062DOI:10.1126/science.aaz8170
David M. J. Lazer et al. , (2025). Computational social science: Obstacles and opportunities. (T. Gugushvili, Trans.). Science369,1060-1062DOI:10.1126/science.aaz8170. (Original work published 2020)
მთარგმნელი: იგულისხმება კოპიუტერის დახმარეით თვისებრივი მონაცემების ანალიზის (Computer-Assisted Qualitative Data Analysis - CAQDA) მიდგომა.↩︎
მონაცემები, რომლიდანაც მჟღავნდება პირის რასობრივი, ეთნიკური კუთვნილება, რელიგიური, ფილოსოფიური ან პოლიტიკური შეხედულებები, ან პირის პროფკავშირში წევრობის ფაქტი, მისი ჯანმრთელობის მდგომარეობა და სქესობრივი ცხოვრების დეტალები. წყარო: http://www.nplg.gov.ge/gwdict/index.php?a=term&d=5&t=16550↩︎
იდეათა და შეხედულებათა ერთობლიობა (უპირატესად საბუნებისმეტყველო მეცნიერებებში); აყალიბებს კონსენსუსურ ჩარჩოს ან მოდელს, რომლის შიგნითაც მეცნიერები ოპერირებენ. წყარო: http://www.nplg.gov.ge/gwdict/index.php?a=term&d=6&t=5646↩︎
წიგნი ხელმისაწვდომია კომპიუტერული სოციალური მეცნიერებები განვითარებისთვის სამაგისტრო პროგრამის ბიბლიოთეკაში↩︎
“Rule of the road”-ის ხელოვნური ინტელექტის განმარტება: https://chatgpt.com/share/680e1bd3-37c8-800f-8377-ca16e24654fd↩︎
“Networked world”-ის ხელოვნური ინტელექტის განმარტება https://chatgpt.com/share/680e234f-d808-800f-8eb9-3cd7014100c8↩︎
მთარგმნელი: ინფორმირებული თანხმობა კვლევის ეთიკის საკვანძო საკითხია. ის გულისხმობს კვლევის მონაწილის, რესპონდენტის კვლევის შესახებ ინფორმაციის მიწოდების შემდეგ კვლევაში მოხალისეობრივად მონაწილეობაზე ან მის შესახებ დიგიტალურად არსებული მონაცემების გამოყენებაზე თანხმობის გაცემას.↩︎
[მთარგმნელი] მონაცემები ხშირად ხელმისაწვდომია ეროვნულ, ან რეგიონულ დონეზე თუმცა არა მუნიციპალურ ან დასახლების დონზე.↩︎
იგულისხმება ამერიკის შეერთებული შტატების პრეზიდენტის არჩევნები https://www.nytimes.com/elections/2016/results/president↩︎
2023 წლიდან ფუნქციონირებს X-ის სახელით↩︎