WEBVTT FILE STYLE ::cue {font-size: 60%;} 00:00:04.480 --> 00:00:29.0 line:-4 position:50% align:center size:85% 안녕하세요 여러분, 오늘의 Scopus AI 웨비나 Navigating Essential Practices in Responsible Gen. AI에 오신 것을 환영합니다. 제 이름은 Elavil 마케팅 팀의 Keith Silvers이며 오늘 세션을 소개할 예정이며, 혹시 질문하실 경우를 대비하여 녹화할 예정입니다. 따라서 녹음을 수집하고 나중에 다시 검토하고 최고의 히트곡을 확인할 수 있습니다. 00:00:30.520 --> 00:00:33.600 line:-4 position:50% align:center size:85% 그럼 오늘의 안건을 살펴보겠습니다. 그래서 우리가 할 수만 있다면. 00:00:37.940 --> 00:01:11.600 line:-4 position:50% align:center size:85% 됐어요. 저는 현재 하우스키핑과 소개 파트를 하고 있습니다. 잠시 후 책임 있는 AI가 무엇이며 왜 중요한지에 대해 이야기할 Harry와 함께 웨비나의 주요 부분으로 이동할 것입니다. 그래서 책임감 있는 AI는 최근 우리 집단 어휘에 들어온 용어라고 생각합니다. 우리는 그것을 많이 사용하지만 종종 그것이 실제로 무엇을 의미하는지 생각하지 않습니다. 그래서 우리는 그것에 대해 조금 더 파헤칠 것입니다. 그런 다음 엘스비어, 특히 Scopus AI가 이러한 책임 있는 AI 원칙을 실천하는 방법에 대해 이야기하겠습니다. 00:01:12.270 --> 00:01:24.270 line:-4 position:50% align:center size:85% 그런 다음 AQ로 넘어가기 전에 엘스비어의 공식 책임 있는 AI 원칙을 살펴보고 마지막에 세션을 진행합니다. 다음 슬라이드로 넘어갈 수 있다면 부탁드립니다. 00:01:25.790 --> 00:01:52.110 line:-4 position:50% align:center size:85% 그래서 Q&A 세션과 관련된 몇 가지 하우스키핑 작업입니다. 오늘 연사들의 강연을 들으면서 궁금한 점이 있으면 주저하지 말고 화면에 보이는 Q&A 버튼을 눌러 입력해 주세요. 그래서 우리가 할 일은 마지막에 질문을 한 다음 제가 뽑아서 전문가 패널에게 제공하는 것입니다. 미리 감사드리지만 다음 슬라이드로 넘어갈 수 있다면 부탁드립니다. 00:01:53.350 --> 00:02:12.700 line:-4 position:50% align:center size:85% 우선 여러분께 질문을 드리고 싶습니다. 이것은 여론조사 질문이고 우리는 오늘 토론의 장을 마련하기 위해 이 질문을 하고 있습니다. 그래서 응답해 주시겠습니까? 현재 귀하 또는 귀하의 연구팀이 연구 워크플로 내에서 GPT 유형의 서비스를 사용하고 있습니까? 00:02:13.560 --> 00:02:21.800 line:-4 position:50% align:center size:85% 1은 절대 안 된다는 뜻이고, 5는 '예'를 의미하며, 우리는 항상 사용하고 있으니 이에 대한 답변을 주시면 매우 감사하겠습니다. 00:02:25.390 --> 00:02:28.470 line:-4 position:50% align:center size:85% 그리고 우리가 할 수 있는지 살펴 보겠습니다. 00:02:32.190 --> 00:02:35.950 line:-4 position:50% align:center size:85% 이에 대해 표시할 수 있는 데이터가 있다면 잠시 후에 표시할 수 있습니다. 00:02:37.950 --> 00:02:41.510 line:-4 position:50% align:center size:85% 드디어 왔구나 하는 생각이 듭니다. 00:02:43.360 --> 00:02:51.400 line:-4 position:50% align:center size:85% 약 60 %, 현재 실제로 아무것도 사용하지 않습니다. 그러니까 아마 75%까지 올라갈 수 있을 겁니다. 그래서 그것은 매우 흥미 롭습니다. 00:02:53.120 --> 00:03:10.880 line:-4 position:50% align:center size:85% 현재 GPT 유형의 솔루션을 정기적으로 사용하는 비율은 14%에 불과하기 때문에 호기심이 많을 것 같지만 아직 많은 분들이 뛰어들지는 않으셨으니 계속 진행할 수 있다면 답변해 주시면 감사하겠습니다. 그리고 오늘 발표자들의 사랑스러운 얼굴이 있습니다. 00:03:11.550 --> 00:03:23.830 line:-4 position:50% align:center size:85% 그래서 책임 있는 AI에 대한 특별한 책임을 맡고 있는 데이터 사이언스 이사인 Harry Muncie가 있습니다. 그래서 우리는 실제로 책임감 있는 AI를 직책에 가진 사람을 두고 있습니다. 00:03:25.320 --> 00:03:39.960 line:-4 position:50% align:center size:85% 또한 수석 제품 관리자인 Adrian Radishaw는 Scopus AI를 전담하고 있습니다. 자, 여기 계신 분들이 잘 계신데요, 진행하기 전에 한 가지 더 여쭤볼 게 있을 것 같습니다. 여기 다시 온다. 00:03:41.430 --> 00:03:52.590 line:-4 position:50% align:center size:85% 마지막으로 Jenny Ice a gene I 솔루션이 책임 있는 AI 개발 원칙이나 정책을 통합하는 것이 얼마나 중요한가요? 00:03:54.360 --> 00:04:04.920 line:-4 position:50% align:center size:85% 다시 말하지만, 5는 정말 중요하다는 것을 의미하고 1은 그다지 중요하지 않다는 것을 의미합니다. 사용하게 될 Gen. AI 솔루션에 책임감 있는 AI를 엔지니어링하는 것이 얼마나 중요한가요? 00:04:07.530 --> 00:04:11.900 line:-4 position:50% align:center size:85% 그러니 잠시 그 자리에서 응답할 시간을 주십시오. 00:04:13.840 --> 00:04:16.400 line:-4 position:50% align:center size:85% 결과가 곧 나타나는지 봅시다. 00:04:19.760 --> 00:04:35.680 line:-4 position:50% align:center size:85% 그리고 OK. 그래서 저는 거기에서 분명한 결과를 얻는다고 생각합니다. 그래서 70%는 올라갈 것이라고 말했고, 63% 이상은 그것이 정말 중요하다고 생각했는데, 이는 우리가 이야기할 내용이기 때문에 여러분이 확실히 올바른 웨비나에 왔다는 것을 의미하기 때문에 좋습니다. 00:04:37.200 --> 00:04:51.280 line:-4 position:50% align:center size:85% 그리고 두 번째 범주에서는 58%가 그 뒤를 이었습니다. 따라서 모든 사람이 책임감 있는 AI가 좋은 것이라고 생각하며, 이는 매우 안심이 됩니다. 그렇다면 객관적으로 도출된 결과를 감안할 때 이제 어떻게 해야 할까요? 00:04:52.550 --> 00:05:01.750 line:-4 position:50% align:center size:85% Harry Muncie는 책임 있는 AI라는 용어가 의미하는 바를 좀 더 깊이 파고들면서 오늘 토론을 시작할 것입니다. 00:05:04.670 --> 00:05:07.870 line:-4 position:50% align:center size:85% Keith, 포괄적 인 소개에 감사드립니다. 00:05:09.720 --> 00:05:30.440 line:-4 position:50% align:center size:85% 그러니까 알고리즘과 자동화의 함정은 잘 문서화되어 있고, 요즘 주류 미디어에서도 꽤 먼저 떠오르는 부분입니다. 다음은 성차별적인 채용 알고리즘부터 차별적인 의사 결정과 자격이 있는 가족의 혜택이 부당하게 박탈된 네덜란드 혜택 스캔들에 이르기까지 여러분이 잘 알고 있을 수 있는 몇 가지 저명한 사례입니다. 00:05:31.630 --> 00:06:02.510 line:-4 position:50% align:center size:85% AI는 일반적으로 방대한 양의 데이터를 사용하여 훈련됩니다. 이 데이터는 기술을 사용하여 개선하려는 일부 의사 결정 프로세스 또는 시스템의 특성을 포착하기 때문에 수집되고 선택되는 경우가 많습니다. 또한 데이터, 그 데이터는 의사 결정 과정이나 시스템이 설계되거나 역사적으로 운영되는 방식의 편견을 반영할 가능성이 높으며, 이는 특정 사람이나 집단의 포함 또는 배제를 통해, 또는 해당 집단 내의 사람들에 대한 이질적인 결과나 결정을 통해 이루어질 수 있습니다. 00:06:03.910 --> 00:06:21.230 line:-4 position:50% align:center size:85% 그리고 이러한 편향을 식별하고 설계하는 데 노력을 투자하지 않으면 AI를 구현할 때 이를 복제하거나 대규모로 증폭할 가능성이 높습니다. 책임감 있게 AI를 개발한다는 것은 AI 시스템을 개발할 때 책임감 있는 설계 결정을 내릴 수 있도록 가드레일을 마련하는 것을 의미합니다. 00:06:22.300 --> 00:06:39.750 line:-4 position:50% align:center size:85% 이를 통해 고객과 사회 전반에 대한 잠재적 이익을 극대화할 수 있을 뿐만 아니라 예상치 못한 부정적인 영향, 편견 또는 오류 및 결과, 의도적 또는 우발적 오용, 투명성 또는 책임성 부족 등을 통해 부정적인 결과의 위험을 최소화할 수 있습니다. 00:06:44.390 --> 00:07:01.150 line:-4 position:50% align:center size:85% 따라서 생성형 AI 또는 Gen. AI는 텍스트나 이미지 또는 코드와 같은 새로운 콘텐츠를 생성하거나 합성하는 데 사용되는 특정 유형의 알고리즘입니다. Genai는 일반적으로 샘플 텍스트 및/또는 이미지의 방대한 데이터 세트에서 훈련된 복잡한 딥 러닝 모델을 사용하여 이를 수행합니다. 00:07:02.440 --> 00:07:14.200 line:-4 position:50% align:center size:85% 대규모 언어 모델 또는 LLMS에서 이러한 용어를 접했을 수 있습니다. 텍스트를 처리하고 생성하는 데 사용되는 특정 유형의 생성형 AI입니다. 생성형 AI는 일부 특정 유형의 작업에 매우 능숙합니다. 00:07:14.950 --> 00:07:25.990 line:-4 position:50% align:center size:85% 예를 들어, 텍스트의 일부를 요약하거나 다시 작성하거나, 학습되거나 프롬프트된 데이터를 합성하여 특정 종류의 특성이나 분위기가 있는 이미지를 생성합니다. 00:07:27.480 --> 00:07:43.800 line:-4 position:50% align:center size:85% 그리고 이것이 문제가 될 수 있는 몇 가지 명백한 방법이 있습니다. 생성형 AI는 평판이 좋은 신문이나 저널리스트 스타일로 인위적으로 생성된 기사든, 정치인이 실제로 말하지 않은 부끄러운 말을 하는 동영상이든, 설득력 있는 합성 콘텐츠를 생성하는 데 매우 능숙합니다. 00:07:45.300 --> 00:08:05.470 line:-4 position:50% align:center size:85% 이것이 특정 작업에 유용한 것은 특히 이 콘텐츠가 의도하지 않은 부정확성(때로는 환각이라고도 함)을 포함할 수 있거나 결함과 같은 고의적인 오보 또는 허위 정보를 생성하기 위해 남용될 때 생성형 AI 및 일반적으로 AI에 대한 우리의 신뢰를 훼손할 수 있습니다. 00:08:06.390 --> 00:08:13.750 line:-4 position:50% align:center size:85% 그리고 현재 인위적으로 생성된 콘텐츠를 감지할 수 있는 확실한 방법은 없으며, 이는 많은 도메인 내에서 문제를 제기하기도 합니다. 00:08:18.110 --> 00:08:47.230 line:-4 position:50% align:center size:85% 이러한 유형의 시스템에서 발생할 수 있는 또 다른 잠재적인 문제는 방대한 양의 학습 데이터에도 불구하고 학습 데이터의 협소성 측면입니다. 예를 들어, 레딧(Reddit)과 위키피디아(Wikipedia)와 같은 인터넷 소스에서 스크랩한 데이터는 가장 인기 있는 생성형 AI 거래 모델 데이터 세트의 일부로 사용되며, 유럽과 북미 백인 남성의 견해를 과도하게 대변하는 것으로 나타났습니다. 이제 이로 인해 다른 인구 통계학적 그룹에 대한 편견을 반영하는 콘텐츠가 생성될 수 있습니다. 00:08:47.830 --> 00:08:53.710 line:-4 position:50% align:center size:85% 예를 들어, 다음은 다양한 직업에 대한 프롬프트를 제공하는 이미지 생성기에 대한 결과를 보여주는 분석입니다. 00:08:54.550 --> 00:09:12.300 line:-4 position:50% align:center size:85% 분석 결과, 고임금 직업을 위해 생성된 이미지 세트는 밝은 피부색을 가진 피험자에 의해 지배된 반면, 어두운 피부색을 가진 피험자는 일반적으로 패스트푸드 종사자 및 사회복지사와 같은 프롬프트에 의해 생성되었습니다. 우리는 성별과 같은 다른 보호되고 민감한 특성에 대해 인코딩된 유사한 편향 패턴을 봅니다. 00:09:13.910 --> 00:09:34.390 line:-4 position:50% align:center size:85% 데이터에 인코딩된 이러한 역사적 편향을 수정할 수 있는 방법에 대한 많은 연구와 노력이 있지만 묘책은 없으며 앞으로도 있을 것이라고 확신할 수 없습니다. 따라서 이러한 문제가 어떻게 나타나고 생성형 AI를 사용하고자 할 수 있는 특정 컨텍스트에서 문제를 일으킬 수 있는지 잘 이해하는 것은 이를 책임감 있게 배포하고 사용할 수 있는 데 매우 중요합니다. 00:09:39.560 --> 00:10:10.200 line:-4 position:50% align:center size:85% 엘사. 우리는 10년 이상 책임감 있게 AI와 머신 러닝 기술을 사용해 왔습니다. 동료 심사 콘텐츠, 데이터 세트 및 분석과 결합된 당사 제품에 사용되어 연구자, 임상의, 교육자가 신뢰할 수 있는 지식을 발견, 발전 및 적용할 수 있도록 지원합니다. 그리고 우리의 내부 및 외부 솔루션은 인간의 의사 결정을 향상시키도록 설계되었습니다. 그리고 이러한 접근 방식은 기업의 사회적 책임에 대한 우리의 약속에 의해 뒷받침되며, 긍정적인 영향을 늘리고 부정적인 영향을 방지하기 위해 적극적으로 노력하고 있습니다. 00:10:11.170 --> 00:10:34.410 line:-4 position:50% align:center size:85% 우리는 그 어느 때보다 정교한 분석과 기술을 사용하여 고부가가치 솔루션을 제공하기 위해 노력하고 있으며, 점점 더 복잡해지는 기술, 의사 결정에 대한 근접성 및 사람들에게 미칠 수 있는 잠재적 영향으로 인해 새로운 과제가 발생하지만 고객과 사회에 도움이 되는 많은 기회도 창출합니다. 이제 Adrian에게 Scopus AI에 대한 소개를 전해드리겠습니다. 00:10:36.300 --> 00:10:57.310 line:-4 position:50% align:center size:85% 정말 고마워, 해리. 안녕 여러분. 제 이름은 Adrian Marshall입니다. 앞서 언급했듯이, 저는 스쿠버 CI의 프로덕트 매니저입니다. 그리고 시작하기 전에, 저는 오늘 LCVM Relics에서 스쿠버 CI를 구축하기 위해 우리의 책임 있는 원칙을 어떻게 활용했는지에 대해 조금 이야기하고 싶습니다. 그러나 먼저 Copassay가 무엇인지에 대한 간략한 개요를 제공하는 것이 매우 유용 할 수 있다고 생각했으며 문제는 시도하고 해결하도록 설계되었습니다. 00:10:58.840 --> 00:11:08.800 line:-4 position:50% align:center size:85% 그래서 스쿠버 CI는 적어도 한동안 조경 학계에 존재했던 문제에서 나왔는데, 우리가 연구자들과 이야기할 때, 그리고 우리가 여론조사를 할 때 그것을 발견했다는 것입니다. 00:11:09.830 --> 00:11:41.120 line:-4 position:50% align:center size:85% 그들로부터 피드백을 받으세요. 특히 Scopus에서 발견한 가장 큰 도전 과제 중 하나는 새로운 주제에 대해 배우고 기회와 분야를 찾는 것이 실제 문제라는 것입니다. 그리고 그것은 특히 초기 경력 검색과 특정 학문적 사일로 내에서 매우 전문화된 사람들에게 진정한 문제입니다. 그리고 그 이유는 아주 분명합니다. 거대하고 계속 성장하는 복잡한 연구 및 학술 환경이 있습니다. 파악해야 할 정보가 너무 많습니다. 그것은 매우 도전적이며, 당신이 그것을 탐색하는 데 실제로 도움이 되는 제한된 도구가 있습니다. 00:11:41.160 --> 00:11:43.200 line:-4 position:50% align:center size:85% 사용 사례에 중요한 것이 무엇인지 정확히 파악합니다. 00:11:43.590 --> 00:12:11.870 line:-4 position:50% align:center size:85% 그리고 사일로에 대해 언급했듯이 자신의 분야에서 이를 유지하는 것은 어렵습니다. 그런 다음 다른 분야의 아이디어를 자신의 분야에 적용할 수 있는 방법을 찾으려고 합니다. 그리고 이 모든 것들이 차선의 생산성과 MIS 협업 및 기회로 이어져 전반적인 영향을 줄였다고 생각합니다. 그래서 작년 즈음에 이 문제를 훨씬 더 쉽게 해결할 수 있도록 도와주는 두 가지 기술이 등장했습니다. 00:12:13.150 --> 00:12:41.910 line:-4 position:50% align:center size:85% 그리고 그것은 특히 우리의 새로운 벡터 검색 기술이었는데, 이는 우리가 질문, 진술, 심지어 몇 가지 키워드의 형태가 될 수 있는 쿼리를 취하고 의미론을 기반으로 관련 학술 초록을 찾을 수 있는 새로운 방법이었습니다. IE 우리는 사람들이 찾고있는 내용과 의도를 이해했습니다. 필요한 것을 설명하기 위해 모든 단어를 알 필요도 없으며 초록을 기반으로 가장 관련성이 높다고 생각되는 콘텐츠와 짝을 이룰 수 있습니다. 00:12:42.640 --> 00:12:43.800 line:-4 position:50% align:center size:85% 그리고 그것은 결합되었습니다. 00:12:44.230 --> 00:12:49.590 line:-4 position:50% align:center size:85% 대규모 언어 모델의 출현과 함께, 우리의 경우 추론 엔진처럼 취급하고 있습니다. 00:12:51.800 --> 00:13:13.400 line:-4 position:50% align:center size:85% I 우리는 어떤 내용이 적절하다고 생각하는지 말하고 대규모 언어 모델에 묻습니다., 이것을 가지고 이해하기 쉬운 것으로 합성하고 사람들이 이 안에 있는 정보에 익숙해지도록 도와줄 수 있습니까? 이 초록 범위는 이 두 기술의 병합에서 탄생하여 새로운 지식 공간에 대해 매우 쉽게 배우고 탐색할 수 있도록 했으며 이를 매우 빠르게 시연할 것입니다. 00:13:14.830 --> 00:13:16.510 line:-4 position:50% align:center size:85% 몇 가지 기능을 간략하게 둘러보세요. 00:13:17.510 --> 00:13:18.510 line:-4 position:50% align:center size:85% 바라건대 작동합니다. 00:13:20.240 --> 00:13:23.0 line:-4 position:50% align:center size:85% 좋아, 그래서 바라건대 화면에 점수 AI 탭이 표시되어야 합니다. 00:13:26.720 --> 00:13:28.280 line:-4 position:50% align:center size:85% 여기에 질문을 입력하겠습니다. 00:13:31.0 --> 00:13:32.800 line:-4 position:50% align:center size:85% 생성형 AI의 위험은 무엇입니까? 00:13:34.630 --> 00:13:59.790 line:-4 position:50% align:center size:85% 그리고 여기서 일어나고 있는 일은 우리의 새로운 벡터 검색 엔진에 대한 검색이 시작되었고, 우리는 이 질문에 직접적으로 답하고 대규모 언어 모델에 제공하는 가장 관련성이 높다고 생각되는 초록을 반환하고 "이봐, 이것을 평가하고 그 정보를 기반으로 포괄적인 요약을 작성할 수 있는지 확인해 줄 수 있겠니?" 그래서 이 모든 것들에 대해, 그리고 우리가 조금 더 이야기할 것인데, 각각의 주장 진술은 투명성을 위한 학술적 초록에 근거를 두고 있습니다. 00:14:01.280 --> 00:14:04.200 line:-4 position:50% align:center size:85% 우리는 또한 이러한 아이디어 중 일부가 어디에서 왔는지 알 수 있습니다. 00:14:05.570 --> 00:14:07.500 line:-4 position:50% align:center size:85% 기초 서류 없이. 00:14:08.110 --> 00:14:12.350 line:-4 position:50% align:center size:85% 또한 공간 내의 몇 가지 주요 개념 아이디어에 대한 간략한 개요를 얻을 수 있습니다. 00:14:15.620 --> 00:14:18.180 line:-4 position:50% align:center size:85% 새로운 어휘에 익숙해지도록 도와주세요. 00:14:19.550 --> 00:14:23.150 line:-4 position:50% align:center size:85% 이에 대해 꽤 많이 알고 있는 일부 주제 전문가를 찾을 수 있습니다. 00:14:26.840 --> 00:14:31.320 line:-4 position:50% align:center size:85% 관련성이 있다고 생각되는 정확한 논문도 확인하십시오. 기본적으로 그 사람이 출판 된 곳입니다. 00:14:32.350 --> 00:14:54.310 line:-4 position:50% align:center size:85% 그리고 어쩌면 이것은 당신이 조금 더 깊이 만들고 싶은 멋진 작은 소개일 수도 있습니다, 우리는 또한 당신의 질문을 가져와서 확장하고, 당신에게 정보의 누락된 조각이 있다는 것을 이해하려고 시도하고 이해하려고 시도하거나, 훨씬 더 포괄적인 것을 작성하기 위해 당신의 다음 질문이 무엇인지 예상하려고 시도하는 것을 요청하는 확장된 요약이라는 기능을 개발했습니다. 00:14:55.680 --> 00:15:07.440 line:-4 position:50% align:center size:85% 물론 주제를 탐구할 때 다음 질문을 아는 것은 매우 어려울 수 있습니다. 그래서 우리는 또한 당신이 매우 쉽게 탐색을 계속할 수 있도록 하는 더 깊이 있는 도구를 만들었습니다. 00:15:07.950 --> 00:15:24.550 line:-4 position:50% align:center size:85% 다양한 방향으로, 그리고 이러한 심층적인 질문들은 단순히 여러분의 질문을 받아들이는 것이 아니라, 그것들이 생성될 때 우리가 고려하고 있는 그것의 몇 가지 변형을 만드는 것입니다. 우리는 대규모 언어 모델에 주제를 확대하거나, 더 큰 관점을 취하거나, 완전히 다른 관점을 취하도록 요청하고 있습니다. 00:15:26.550 --> 00:15:36.700 line:-4 position:50% align:center size:85% 이것이 벡터 검색과 결합된 대규모 언어 모델을 통해 새로운 주제에 대해 배우고 새로운 기회를 찾는 데 도움이 되는 훌륭한 도구를 만들 수 있는 힘입니다. 00:15:38.690 --> 00:15:53.330 line:-4 position:50% align:center size:85% 그래서 제가 얘기할 수 있는 것은, 오, 우리는 슬라이드를 잃어버렸다는 것입니다. 그래서 제가 얘기해야 할 것은 이 제품을 만드는 데 책임 있는 AI 원칙을 어떻게 활용했는가 하는 것인데, 이에 대해서는 좀 더 자세히 설명하겠습니다. 이제 해리에게 돌아가 그 원칙에 대해 간략히 설명하겠습니다. 00:15:54.350 --> 00:15:57.470 line:-4 position:50% align:center size:85% 좋습니다. 당신에게. 고마워, 애드리안. 00:15:58.960 --> 00:16:29.480 line:-4 position:50% align:center size:85% 그래서 2022년에 우리는 책임감 있는 AI 원칙을 발표했습니다. 이러한 원칙은 기계 기반 인사이트 및 AI를 설계, 개발, 배포하는 모든 사람에게 높은 수준의 지침을 제공합니다. 우리는 AI 지원 솔루션에 적용할 수 있는 기존의 강력한 정책과 프로세스를 이미 갖추고 있습니다. 책임 있는 AI 원칙의 목적은 전례 없는 속도와 규모, 급속한 발전으로 지속적으로 진화하는 분야인 AI를 보완하는 것입니다. 00:16:30.520 --> 00:16:35.240 line:-4 position:50% align:center size:85% 그리고 지난 1년 또는 1년 반 동안 생성형 AI가 확산된 것이 그 좋은 예입니다. 00:16:36.350 --> 00:16:44.710 line:-4 position:50% align:center size:85% 우리의 책임 있는 AI 원칙은 우리 회사 및 다른 조직 내에서 일종의 모범 사례를 활용하는 위험 기반 프레임워크를 제공합니다. 00:16:46.400 --> 00:17:02.520 line:-4 position:50% align:center size:85% 시간이 지남에 따라 동료 및 고객 피드백과 업계 및 입법 동향을 기반으로 반복됩니다. 그리고 이를 통해 우리는 솔루션이 비즈니스로서의 가치에 따라 개발되도록 사전 예방적으로 할 수 있습니다. 그러나 예를 들어 실제로 그리고 특히 Scopus AI에서 이것이 의미하는 바는 무엇입니까? 00:17:05.500 --> 00:17:38.200 line:-4 position:50% align:center size:85% 따라서 원칙 자체를 확대하면 첫 번째 원칙은 솔루션이 사람들에게 미치는 실제 영향을 고려하는 것입니다. 따라서 우리는 우리의 솔루션이 고객의 의사 결정에 도움이 될 수 있다는 것을 알고 있으며 우리의 솔루션이 사람들에게 미칠 수 있는 잠재적인 영향을 염두에 두고 있습니다. AI는 고객뿐만 아니라 회사의 비즈니스 문제를 해결하는 방법으로, 일련의 가정과 시스템이 배포되는 특정 실제 상황을 적용합니다. 그리고 우리가 그 맥락을 더 잘 이해할수록, 더 많은 자각을 하게 되고, 우리의 가정에 대해 더 잘 알게 됩니다. 00:17:38.310 --> 00:17:52.470 line:-4 position:50% align:center size:85% 그리고 우리가 더 나은 솔루션을 만들수록 고객을 위한 더 높은 부가가치를 창출할 수 있습니다. 따라서 우리는 무엇을 만들고 있는지, 누가 고객인지를 묻는 것을 넘어 우리 솔루션의 혜택을 받을 수 있는 사람들의 범위와 영향을 받을 수 있는 방법과 사람, 그리고 그 이유를 파악하려고 노력합니다. 00:17:53.390 --> 00:17:58.630 line:-4 position:50% align:center size:85% 그럼, Adrian, 이것이 Scopus에 어떻게 적용되는지 조금 더 이야기해 줄 수 있을까요? 절대로. 00:18:00.280 --> 00:18:00.360 line:-4 position:50% align:center size:85% 그렇게. 00:18:01.700 --> 00:18:32.990 line:-4 position:50% align:center size:85% Alice Scopes, 저는 솔루션이 사람들에게 미치는 실제 영향에 대해 생각합니다. 알 세피라의 모든 생성형 또는 AI 기반 솔루션에서 가장 먼저 하는 일 중 하나는 알고리즘 영향 평가라는 것을 수행하는 것인데, 이는 캐나다 정부를 기반으로 하고 ADA 러브레이스 연구소(ADA Lovelace Institute)의 승인을 받은 도구입니다. 이것은 우리가 어떤 솔루션을 사용하고 있는지, 어떤 기술, 어떻게 사용되고 있는지 살펴보고 그들이 추진할 것으로 생각되는 이점이 무엇인지 이해하려고 노력하는 포괄적이고 효과적인 평가입니다. 00:18:33.150 --> 00:18:38.830 line:-4 position:50% align:center size:85% 위험은 무엇이고, 약점은 무엇이며, 어떻게 잠재적으로 유해한 이유로 오용될 수 있습니까? 00:18:40.320 --> 00:19:03.240 line:-4 position:50% align:center size:85% 이 보고서 평가가 완료된 후 제품, 데이터 과학, 엔지니어링 및 엘스비어 내의 다양한 분야로 구성된 다양한 부서의 검토를 거쳐 엘스비어가 철저한 영향 평가와 실제 영향 측면에서 모든 기반을 다뤘는지 확인합니다. 00:19:03.670 --> 00:19:23.910 line:-4 position:50% align:center size:85% 우리는 학계와 직접 소통하여 이러한 해결책에 대한 여러분의 생각, 우려 사항에 대한 피드백을 받고, 이와 같이 공개적으로뿐만 아니라 비공개적으로, 심지어 일대일로 지속적으로 수행합니다. 이러한 우려와 위험은 솔루션 개발에 영향을 미치기 때문에 커뮤니티의 기대에 부합하는지 확인하는 것이 정말 중요합니다. 00:19:25.700 --> 00:19:28.710 line:-4 position:50% align:center size:85% 이제 해리에게 우리의 두 번째 원칙에 대해 이야기해 보도록 하겠습니다. 00:19:30.400 --> 00:19:43.440 line:-4 position:50% align:center size:85% 고마워, 애드리안. 따라서 두 번째 원칙은 불공정한 편견이 생성되거나 강화되는 것을 방지하기 위한 조치를 취하는 것입니다. 따라서 이 원칙의 목적은 양질의 결과를 도출하고 차별을 피하는 것입니다. 00:19:44.880 --> 00:19:49.520 line:-4 position:50% align:center size:85% 공정성과 비차별을 촉진하는 것은 우리의 비즈니스 철학과 가치의 핵심입니다. 00:19:51.0 --> 00:19:57.520 line:-4 position:50% align:center size:85% 우리는 수학적 정확성이 편견으로부터의 자유를 보장하지 않는다는 것을 알고 있으며, 이것이 바로 불공정한 편견의 생성 또는 강화를 방지하기 위해 행동하는 이유입니다. 00:19:58.400 --> 00:20:08.880 line:-4 position:50% align:center size:85% 오늘 세션의 앞부분에서 살펴본 바와 같이, 이러한 조치를 취하지 않으면 데이터 입력, 입력, 처리 또는 알고리즘 자체를 통해 의도치 않게 구매자가 유입될 수 있습니다. 00:20:10.400 --> 00:20:28.440 line:-4 position:50% align:center size:85% 그리고 편향은 편향된 결과로 이어질 수 있으며, 따라서 결과의 정확도 측면에서 잠재적으로 가치가 떨어질 수도 있습니다. 그러나 성별, 민족, 사회 경제적 지위 또는 기타 개인적 특성에 따라 개인이나 그룹에 덜 유리한 결과를 초래할 수도 있습니다. 00:20:29.310 --> 00:20:36.190 line:-4 position:50% align:center size:85% 따라서 불공정한 편견의 생성 또는 강화를 방지하기 위한 조치에는 절차 및 검토 구현과 같은 것이 포함될 수 있습니다. 00:20:37.720 --> 00:20:47.560 line:-4 position:50% align:center size:85% 데이터 수집과 관련된 문서화 프로세스와 사용 가능한 자동 편향 감지 도구 사용 등이 있습니다. Adrian, Scopus AI는 어떻게 보였나요? 00:20:49.510 --> 00:21:18.390 line:-4 position:50% align:center size:85% 그러니 부당한 편견의 생성이나 강화를 막기 위한 조치를 취합시다. 해리 레니(Harry Rennie)는 앞서 대규모 언어 모델들은, 특히 그 자체만으로는 진실하도록 설계되지 않았다고 언급했다. 그들은 설득력을 갖도록 설계되었으며 물론 그들이 훈련하는 데이터는 그들이 반응하는 방식에 큰 영향을 미칠 수 있습니다. 이것이 바로 물리적인 CIA가 Generations Bicycle 사이트를 학술 콘텐츠에 직접 적용하는 모델을 채택한 이유이며, 몇 가지 이유로 이렇게 하는 이유입니다. 00:21:18.590 --> 00:21:45.270 line:-4 position:50% align:center size:85% 그 누구도 우리의 응답에 대한 투명성을 만들 수 있기를 원한다고 믿지 않습니다. 따라서 어떤 주장이나 가정이 만들어지든, 우리는 그 주장이나 가정을 알려주는 추상 또는 초록을 직접 가리켜 매우 쉽게 뒷받침할 수 있어야 합니다. 이것은 우리가 보유할 수 있기 때문에 매우 유용하며, 우리는 다양한 시스템이 고품질 답변을 생성하기 위해 올바른 종류의 응답을 생성할 책임을 지도록 할 수 있습니다. 그리고 일이 잘못되었을 때 왜 잘못되었는지도 식별할 수 있습니다. 00:21:46.270 --> 00:22:03.449 line:-4 position:50% align:center size:85% 그리고 우리가 이러한 초록을 선택하는 방법은 오픈 소스 미니 LM 벡터 모델을 기반으로 합니다. 그리고 우리가 하는 일은 코사인 유사성(cosine similarity)이라고 불리는 것을 우선시하는 것인데, 이는 사실상 당신이 말하는 것을 알아내려고 시도하는 작은 언어 모델을 기반으로 하는 수학 방정식으로, 어떤 초록이 그 질문이나 질문에 답하는 데 도움이 되는 정보를 가지고 있는지 또는 그것에 대한 정보를 가지고 있는지 식별하려고 합니다. 이것은 매우 중요한데, 왜냐하면 우리가 인용이나 어쩌면 무언가가 출판된 곳을 더 많이 기다렸 00:22:03.449 --> 00:22:20.629 line:-4 position:50% align:center size:85% 다면, 그것은 우리가 하고 있는 일이 아니었기 때문입니다. 00:22:20.990 --> 00:22:30.910 line:-4 position:50% align:center size:85% 답변의 품질은 실제로 떨어질 것이므로 항상 쿼리에 직접 답변할 수 있는 가장 관련성이 높은 정보가 있는 최고 품질의 초록을 선택하는 것이 좋습니다. 00:22:32.600 --> 00:22:51.800 line:-4 position:50% align:center size:85% 물론 여기에는 위험이 있습니다. 우리는 때때로 해롭거나 편견이 없을 수 있습니다. 또한 사용자가 직접 보고할 수 있도록 Scopus AI에 대한 도구도 제공합니다. 그리고 각 응답은 팀에서 수동으로 검토하며, 이를 사용하여 로드맵을 알리는 데 도움을 줍니다. 그러나 우리는 이것만으로는 충분하지 않다는 것을 알고 있습니다. 00:22:52.830 --> 00:23:20.590 line:-4 position:50% align:center size:85% 우리가 하는 또 다른 일은 내부 및 외부 쿼리 목록을 활용하는 것입니다. Quora의 Insysia는 Scopus AI에서 유해하거나 편향된 응답을 얻기 위해 의도적으로 분류에 의문을 제기합니다. 이것은 정말 중요합니다. 이는 일종의 레드 팀 구성의 일환으로, 우리는 이러한 테스트를 정기적으로 실행하여 유해하다고 생각되는 응답을 생성하는 경우 해당 응답이 어디에서 왔는지 알고 시간이 지남에 따라 모니터링할 수 있는지 확인합니다. 00:23:22.200 --> 00:23:28.780 line:-4 position:50% align:center size:85% 그리고 이 모든 것은 CI 제품의 범위를 가장 신뢰할 수 있는 버전으로 설계하고 지속적으로 구축하는 방법에 다시 한 번 기여합니다. 00:23:30.300 --> 00:23:33.910 line:-4 position:50% align:center size:85% 이것으로 세 번째 원칙을 해리에게 넘겨주겠습니다. 00:23:36.280 --> 00:23:43.960 line:-4 position:50% align:center size:85% 고마워 애드리안. 세 번째 원칙은 솔루션이 어떻게 작동하는지 적절한 수준의 투명성으로 설명할 수 있다는 것입니다. 00:23:45.920 --> 00:24:01.320 line:-4 position:50% align:center size:85% 사용자와 규제 기관을 포함한 모든 이해 관계자에게 적절한 수준의 미안함을 제공합니다. 그리고 이 원칙이 반드시 우리가 어떤 모델을 만들고 사용할 수 있는지 규정하는 것은 아닙니다. 그렇다고 해서 폐쇄형 박스 모델을 사용하지 않겠다는 의미도 아닙니다. 00:24:02.470 --> 00:24:31.430 line:-4 position:50% align:center size:85% 그러나 여기서의 목표는 각 애플리케이션 및 사용 사례에 대해 적절한 수준의 투명성을 확보하여 다양한 사용자가 출력을 이해하고 신뢰할 수 있도록 하는 것입니다. 다른 맥락과 다른 청중은 다른 설명을 요구할 것입니다. 따라서 설계 프로세스의 일환으로 시스템의 어떤 요소를 누구에게 설명해야 하는지, 어떻게 설명해야 하는지 고려합니다. 또한 신뢰성에 대한 솔루션을 평가하고 의도된 용도에 대해 명시합니다. 스코푸스, 아드리안에게는 어때요? 00:24:32.670 --> 00:25:00.990 line:-4 position:50% align:center size:85% 그렇다면 솔루션의 작동 방식을 어떻게 설명할 수 있을까요? 이미 조금 들어보셨을 겁니다. 우리는 특히 Scopus 콘텐츠를 기반으로 하는 큰 숫자 모델의 세대를 기반으로 하고 있습니다. 지금 우리는 다양한 내용의 초록을 제공하고 영리한 프롬프트 엔지니어링을 통해 이 정보만을 기반으로 이 쿼리에 대한 적절한 응답을 생성할 수 있습니까? 그리고 다시 말하지만, 앞서 언급했듯이 이 작업을 수행할 때마다 지금 사용된 참조 또는 참조로 주장이나 가정을 백업하십시오. 00:25:01.800 --> 00:25:06.600 line:-4 position:50% align:center size:85% 이것이 우리가 이해할 수 있는 진실의 원천에 대한 우리의 대응을 시도하고 근거를 두기 위해 우리가 취해온 접근 방식입니다. 00:25:07.470 --> 00:25:22.930 line:-4 position:50% align:center size:85% 그러나 또한 그 이상입니다. 우리가 단지 거대한 조직적 증오를 말하는 것이 아닙니다. 이것을 요약하십시오. 우리는 지난 몇 달 동안 학계에서 일하면서 많은 것을 배웠고 이러한 요약의 최고 품질 버전을 만드는 방법을 배웠습니다. 또한 초록이 모든 것에 답할 수는 없다는 것을 알고 있습니다. 그들은 사람들이 새로운 영역을 탐험하려고 할 때 묻는 대부분의 유형의 질문에서 우리가 찾은 훌륭한 일을 합니다. 그러나 우리는 또한 정의나 우리가 덜 잘하는 비교 질문과 같은 특정 질문이 있다는 것을 알고 있는데, 이는 단순히 그 정보가 초록에 없 00:25:22.930 --> 00:25:38.390 line:-4 position:50% align:center size:85% 기 때문입니다. 00:25:38.830 --> 00:26:07.350 line:-4 position:50% align:center size:85% 이러한 이유로 우리는 요약만 하는 것이 아니라 Scopus AI 내에 반사 레이어도 도입했는데 이제 조금 이야기하고 싶습니다. 그리고 이 반사 레이어가 효과적으로 하는 일은 AI가 정보를 보고 응답을 생성하는 데 얼마나 자신감이 있는지 알아내려고 하는 것입니다. 그리고 직접 응답의 경우 높은 수준의 신뢰도를 가지며 중간 수준의 신뢰도에 대해 추론된 응답을 가지며 응답이 없습니다. 00:26:07.470 --> 00:26:39.190 line:-4 position:50% align:center size:85% 낮은 신뢰도. 제가 보여드린 데모에서 이미 보셨을 수도 있겠지만, 저는 질문을 할 수 있었고 우리의 경우 매우 직접적인 답변을 받았습니다. IE는 우리의 스쿠버 사이트가 그 질문에 대한 직접적인 답변을 제공할 수 있다고 매우 확신했습니다. 하단에서 눈치채셨을지 모르지만 때로는 직접적인 응답에도 뉘앙스를 제공합니다. 예를 들어, 정보가 누락되었거나 모든 측면을 다루지 않을 수 있습니다. 또는 어떤 것이 이미 한 분야에 심하게 편향되어 있는 경우, 이것이 더 넓은 관점을 대표하지 않을 수 있다고 말함으로써 경고할 수 있습니다. 00:26:41.340 --> 00:27:06.200 line:-4 position:50% align:center size:85% 그런 다음 중간 신뢰도의 경우 추론된 응답이 있습니다. 이것은 Scotia가 초록에 직접적인 응답이 없다고 결정했을 때이며, IE는 그것을 그대로 언급하지 않았지만 제공된 정보에서 실제로 추론 할 수 있다고 생각합니다. 예를 들어, 이 주제에 대한 직접적인 정보를 제공할 수는 없지만 일부 정보는 추론할 수 있으며 해당 정보를 추론한 방법도 설명할 수 있습니다. 00:27:08.680 --> 00:27:38.360 line:-4 position:50% align:center size:85% 그리고 마지막으로 응답이 없습니다. 때로는 귀하의 질문에 대한 답변이 없는 경우가 있습니다. 그리고 예, 이것은 약간 어리석은 질문이지만 우리가 답할 수 없는 매우 심각한 질문이 있습니다. 그리고 이 경우 CI의 낭비가 작동해야 합니다. 이 쿼리에 도움이 되는 관련 정보가 없다는 것이 매우 분명합니다. 그렇다고 해서 정보가 어딘가에 존재하지 않는다는 의미는 아닙니다. 그리고 이러한 방식으로 프레임워크를 적용하는 것의 좋은 점은 여기서 한계가 대규모 언어 모델이 아니라 검색 서비스라는 것을 보여준다는 것입니다. 00:27:38.550 --> 00:27:55.350 line:-4 position:50% align:center size:85% 즉, 우리는 이제 이와 같은 쿼리를 가지고 들어가서 Scopus가 이에 대한 답변을 제공하는 정보가 있으면 어디로 가는지, 왜 우리는 그것을 못합니까? 그리고 이러한 수준의 투명성은 팀과 제가 미래에 더 나은 검색을 위해 어떤 종류의 기술에 투자해야 하는지 알아내는 데 도움이 됩니다. 00:27:57.340 --> 00:28:00.380 line:-4 position:50% align:center size:85% 이것으로 해리에게 4대 교장 선생님을 넘겨주겠습니다. 00:28:01.870 --> 00:28:03.390 line:-4 position:50% align:center size:85% 고마워 애드리안. 그것은 매우 분명합니다. 00:28:04.920 --> 00:28:17.320 line:-4 position:50% align:center size:85% 우리의 네 번째 원칙은 인간의 감독을 통해 책임을 창출하는 것입니다. 따라서 이를 통해 Adrian이 설명한 출력물에 대한 지속적이고 강력한 품질 보증이 가능하며 의도하지 않은 사용을 미연에 방지할 수 있습니다. 00:28:19.0 --> 00:28:33.800 line:-4 position:50% align:center size:85% 우리의 기술은 고객의 의사 결정 프로세스를 지원하므로 인간이 AI 시스템의 개발, 사용 및 결과에 대한 소유권과 책임을 갖는 것이 중요합니다. 우리는 시스템의 수명 주기 전반에 걸쳐 사람의 감독을 적용합니다. 00:28:33.630 --> 00:28:37.790 line:-4 position:50% align:center size:85% 그리고 이것은 시스템의 품질과 적절한 성능을 보장하는 분기입니다. 00:28:38.590 --> 00:28:57.710 line:-4 position:50% align:center size:85% 솔루션이 우리 손에 맡겨지면 고객이 최종 의사 결정자의 역할을 맡게 됩니다. 그러나 고객 지원 동료는 고객이 의도한 용도를 잘 이해하고 당사에 보고된 품질 문제를 내부 팀에서 적절하게 처리하도록 하는 데 정말 중요한 역할을 합니다. 00:28:59.200 --> 00:29:02.160 line:-4 position:50% align:center size:85% 아드리안, 스코푸스가 어떻게 생겼는지에 대해 얘기해보도록 하겠습니다. 00:29:03.430 --> 00:29:23.790 line:-4 position:50% align:center size:85% 고마워, 해리. 따라서 인간의 감독을 통해 책임감을 창출하고, Scopus, AI, 그리고 이미 말씀드린 이러한 사항 중 일부는 우리가 선택한 솔루션의 위험과 유해한 응용 프로그램을 식별하는 방법에 대한 알고리즘 영향 평가와 교차 기능 팀과 함께 가시성을 확보하려고 노력하는 실제 인간 그룹이 있습니다. 00:29:25.280 --> 00:29:35.120 line:-4 position:50% align:center size:85% 이러한 감독을 만들고 우리가 개발하는 솔루션에 대한 책임을 만드는 데 정말 중요합니다. 또한, 유해한 반응을 나열하기 위한 평가 프레임워크에 대해 이야기하는 것을 들으셨습니다. 00:29:35.630 --> 00:30:07.990 line:-4 position:50% align:center size:85% 그 외에도 응답의 품질을 살펴보는 프레임워크도 있습니다. 따라서 어떤 영역에서 정말 잘 수행되고 어떤 영역이 제대로 수행되지 않는지 매우 명확하게 매핑할 수 있습니다. 그래서 전혀. 그런 다음 팀으로 받는 이러한 유형의 쿼리에 대해 종합적으로 검토하고 이를 사용하여 제품 로드맵에 알리고 이 제품의 최상의 버전을 다시 만들 수 있습니다. 물론 우리는 이와 같은 많은 사용자 피드백 포럼과 개인뿐만 아니라 제품에 대해서도 요청합니다. 그리고 이러한 피드백을 사용하여 어떤 종류의 새로운 기능을 개발할지 결정하는 데 도움을 줍니다. 00:30:08.390 --> 00:30:15.270 line:-4 position:50% align:center size:85% 우리가 해야 할 일을 제대로 하지 못하고 있는 부분을 이해하고, 이 모든 것을 사용하여 실제 수학을 알리고 제품의 성능을 개선하는 데 도움을 줍니다. 00:30:17.100 --> 00:30:20.890 line:-4 position:50% align:center size:85% 그리고 그것으로 나는 그것을 마지막 원칙으로 다루고 싶습니다. 00:30:23.290 --> 00:30:52.130 line:-4 position:50% align:center size:85% 따라서 다섯 번째이자 마지막 원칙은 개인 정보를 존중하고 강력한 데이터 거버넌스를 옹호하는 것입니다. 따라서 이 원칙은 우리가 신뢰할 수 있는 정보 솔루션 제공업체로 계속 인정받을 수 있도록 합니다. 데이터의 적절한 수집, 재현성, 사용 및 보호는 정보 및 분석 비즈니스로서의 성공에 매우 중요합니다. 따라서 데이터 자산을 유지 관리 및 확장하고 고객을 위한 인사이트를 생성하는 새로운 방법을 발견하고 사용할 때 이를 올바르게 파악해야 합니다. 00:30:52.350 --> 00:31:10.569 line:-4 position:50% align:center size:85% 우리는 강력한 데이터 거버넌스가 필수적이라는 것을 알고 있습니다. AI 시스템은 대량의 고품질 데이터를 공급받을 때 더 정확하게 작동합니다. 그리고 일부 데이터 세트는 다양한 목적으로 다양한 솔루션에서 사용됩니다. 따라서 강력한 데이터 관리, 보안 정책 및 절차를 마련해야 하며 일부 데이터 세트에는 개인 정보도 포함될 수 있습니다. 따라서 조직으로서 당사는 모든 해당 개인 정보 보호법 및 규정에 따라 개인 정보를 취급할 뿐만 아니라 항상 개인 정보에 대한 책임 있는 관리자 역할을 할 것을 요구하는 자체 개인 정보 보호 원칙에 따라 00:31:10.569 --> 00:31:28.789 line:-4 position:50% align:center size:85% 개인 정보를 처리하기 위해 최선을 다하고 있습니다. 00:31:29.710 --> 00:31:32.510 line:-4 position:50% align:center size:85% 그렇다면 Scopus AI Adrian은 어떻게 될까요? 00:31:34.390 --> 00:31:43.950 line:-4 position:50% align:center size:85% 그래서 Scoversci에 있는 대부분의 사람들에게 진짜 질문은 당신의 쿼리에 무슨 일이 일어나고 있는지, 우리가 그 정보를 어떻게 훈련시키는지입니다. 그러니 정말 명확해야 합니다. 00:31:45.300 --> 00:32:02.550 line:-4 position:50% align:center size:85% Arts 쿼리는 Scopus 쿼리가 검색에 대해 처리되는 것과 정확히 동일한 방식으로 처리됩니다. 과거에는 개인 정보 보호 정책 및 전 세계의 다양한 개인 정보 보호 정책에 따라 이러한 내용을 유지했으며 이전과 동일한 방식으로 적용됩니다. 우리는 그들과 함께 다른 어떤 것도 하지 않습니다. 00:32:03.630 --> 00:32:20.550 line:-4 position:50% align:center size:85% 한 가지 질문은 이러한 쿼리와 대규모 언어 모델에서 무슨 일이 일어나고 있느냐는 것입니다. Microsoft와 계약을 체결하여 가장 긴 대형 모델(이 경우 ChatGPT)을 지나는 쿼리는 Microsoft가 제공하는 대규모 평균 모델을 학습하거나 개선하는 데 사용되지 않습니다. 00:32:21.470 --> 00:32:34.350 line:-4 position:50% align:center size:85% 그리고 마지막으로 스코어 코퍼스 자체입니다. Scopus는 콘텐츠 선정 및 자문 자문 위원회의 엄격한 심사를 거친 말뭉치를 보유하고 있어 정말 운이 좋습니다. 00:32:35.880 --> 00:32:49.160 line:-4 position:50% align:center size:85% 이는 사람들에게 직접적인 책임을 물을 수 있는 건강 계정을 보유한 신뢰할 수 있는 응답을 제공하기 위해 대규모 언어 모델을 제공하는 데 사용할 수 있는 최고 품질의 관심 콘텐츠를 확보하는 데 정말 중요합니다. 00:32:50.110 --> 00:32:56.390 line:-4 position:50% align:center size:85% 따라서 이러한 것들 사이에서 저는 우리가 개인 정보를 존중하고 강력한 데이터 거버넌스를 옹호하는 일을 제대로 하고 있다고 생각합니다. 00:32:58.140 --> 00:33:02.420 line:-4 position:50% align:center size:85% Person, Baker, Harry For 그리고 이것이 우리의 5가지 AI 원칙입니다. 00:33:03.800 --> 00:33:05.400 line:-4 position:50% align:center size:85% 해리, 이것에 대해 더 하고 싶은 말이 있니? 00:33:06.720 --> 00:33:22.440 line:-4 position:50% align:center size:85% 제 생각에는 그게 거의 전부인 것 같아요. 따라서 책임감 있는 AI 원칙이 어떤 모습인지 잘 이해하셨을 뿐만 아니라 이 원칙이 우리 조직에 왜 그렇게 중요하다고 생각하는지, 그리고 Scopus AI 개발을 형성하는 데 어떻게 사용되었는지에 대한 약간의 동기 부여도 받으셨기를 바랍니다. 00:33:27.410 --> 00:33:30.810 line:-4 position:50% align:center size:85% 다음 슬라이드로 넘어갈 수 있다면 부탁드립니다. 00:33:32.280 --> 00:33:58.120 line:-4 position:50% align:center size:85% 고마워요, 해리와 에이드리언. 제 생각에 이 원칙들의 가장 큰 장점은 여러분이 온라인을 통해 그것들을 접하는 것을 환영할 수 있고, 음, 그것들은 매우 추상적이고 매우 고상하게 들릴 수 있고, 물론 엘시가 그렇게 말할 수도 있다는 것입니다. 하지만 저는 에이드리언과 해리가 보여준 것이 우리가 정말로 이러한 원칙에 따라 살고 있으며, 그 원칙이 AI와 다른 도구로서의 범위 개발의 모범 사례에 뿌리를 두고 있다는 것을 보여주기를 바랍니다. 00:33:59.700 --> 00:34:17.110 line:-4 position:50% align:center size:85% 이제 질문이 하나 더 있음을 알 수 있습니다. 이 웨비나를 본 후 정책의 책임 있는 AI 개발 원칙의 중요성을 더 잘 이해하셨습니까? 그렇다면 우리는 시간을 낭비하고 있습니까, 아니면 정말 유용합니까? 예, 좋았다고 생각하면 아니요, 나빴다고 생각하면 아니요. 00:34:18.440 --> 00:34:24.120 line:-4 position:50% align:center size:85% 무서운 진실이 무엇인지 보자. 닫기 버튼을 누르면 볼 수 있습니다. 00:34:25.750 --> 00:34:55.110 line:-4 position:50% align:center size:85% 그래서 저는 여러분 중 98%가 우리가 다른 곳과 관련하여 책임감 있는 AI 개발에 대해 적어도 어느 정도 빛을 비추는 일을 잘 해냈다고 생각한다는 사실에 안도감을 느낍니다. 그래서 나는 당신이 나를 바보처럼 보이게 하기 위해 나를 반박하기 시작하기 전에 그것에서 벗어날 것입니다. 이 웨비나의 Q&A 섹션으로 넘어갈 수 있습니다. 우선 첫 번째 질문은 다음과 같습니다. 00:34:56.350 --> 00:35:05.300 line:-4 position:50% align:center size:85% Scopus에 저작권 침해가 없는지 어떻게 확인할 수 있습니까? AII는 누가 우리를 걷어차기 위해 이것을 가져가고 싶어하는지 모르지만 꽤 유감입니다 1. 00:35:08.480 --> 00:35:22.160 line:-4 position:50% align:center size:85% 그러니까 제 말은, 저희와 조금 얘기할 수 있는데 저작권 침해가 무엇을 의미하느냐에 따라 달라질 것 같습니다. 따라서 추상적인 콘텐츠는 일반적으로 퍼블릭 도메인 내에 있는 것으로 간주되며 점수에 따라 최소한 이와 같은 서비스를 위해 해당 콘텐츠를 사용할 수 있는 권리가 있습니다. 00:35:23.640 --> 00:35:37.120 line:-4 position:50% align:center size:85% 그러나이 질문은 대규모 언어 모델 내에서 저작권 침해와 관련하여 발생하는 더 큰 주제, 즉 이러한 대규모 언어 모델을 훈련하는 데 사용되는 데이터와 관련이 있다고 생각합니다. 최근 뉴욕타임스가 좋은 예다. 00:35:39.110 --> 00:35:54.430 line:-4 position:50% align:center size:85% 예, 시나리오를 기다리고 있습니다. 많은 수의 모델에 대한 저작권 침해로 간주되는 것이 정확히 무엇인지에 대해 알려지지 않은 것이 많다고 생각합니다. 현재 우리가 많은 관심을 기울이고 있는 영역입니다. 그리고 결과에 따라 몇 가지 다른 법정 절차가 있다는 것을 알고 있습니다. 글쎄요, 잠재적인 법정 절차나 청문회가 올해 미국에서 진행되고 있으며 아마도 EU도 상상할 수 있을 것입니다. 그것은 그것이 무엇을 의미하는지에 대한 지침을 제공하는 데 도움이 될 것입니다. 그리고 우리가 발전해야 했던 것처럼, 우리는 적응할 것입니다. 해결책 00:35:54.430 --> 00:36:09.750 line:-4 position:50% align:center size:85% 은 적절하게 CI가 될 것입니다. 00:36:12.890 --> 00:36:29.330 line:-4 position:50% align:center size:85% 네, 제 말은, 여기에 덧붙이자면, 이것은 규제 당국이 기존 저작권법의 일종뿐만 아니라 새로운 AI 규정이 테스트되기 시작함에 따라 더 명확성을 제공하기 시작할 것이라고 생각하는 영역입니다. 00:36:30.680 --> 00:36:54.200 line:-4 position:50% align:center size:85% Adrian이 말했듯이 이는 우리가 모니터링하고 있는 것이며 일정 수준의 유연성을 갖춘 시스템을 구축하는 것을 목표로 하고 있습니다. 따라서 이러한 대규모 언어 모델 제공업체 중 일부가 가능한 경우 데이터 세트의 저작권 침해와 관련하여 조치를 조금씩 정리하기 시작하는 것을 보기 시작함에 따라 AI 시스템을 구동할 모델을 선택할 때 이를 차별화 요소로 사용할 수 있습니다. 00:36:55.300 --> 00:37:15.910 line:-4 position:50% align:center size:85% 엘스비어에서 사용하는 모델 또는 데이터 세트에 대해 이야기할 때, 엘스비어는 사용하는 모든 데이터 세트와 관련된 모든 권리를 존중하고 모델을 훈련하기 위해 데이터를 사용하는 경우 그렇게 할 수 있는 권리가 있는지 확인하기 위해 내부적으로 엄격한 내부 프로세스를 운영하고 있습니다. 00:37:17.660 --> 00:37:32.260 line:-4 position:50% align:center size:85% 고마워, 해리. 그래서 여기 우리가 전에 본 것 같은 질문은 우리가 범위에 대한 답을 도출하는 내용의 종류와 관련이 있습니다. 00:37:33.840 --> 00:37:44.920 line:-4 position:50% align:center size:85% 아니면 방법이나 논문 등을 사용합니까? 그래서 우리가 초록을 사용하는지, 왜 우리가 다른 종류의 콘텐츠와 함께 초록을 사용하는지에 대한 질문은 검색 결과를 생성하는 데 좋습니다. 00:37:46.440 --> 00:37:51.440 line:-4 position:50% align:center size:85% 물론, 나는 그렇게 할 수 있습니다. 따라서 요약은 추상적인 내용을 기반으로 합니다. 00:37:52.920 --> 00:38:14.480 line:-4 position:50% align:center size:85% 그것들은 우리가 관련성 있고 관련성 있는 전체 텍스트의 요점이라고 생각하는 것에 대한 훌륭한 스냅샷입니다. 그리고 그것은 주로 우리가 요약을 생성하는 데 사용하는 것, 콘텐츠 맵입니다. 우리는 관련 문서와 관련된 키워드로 작성자를 활용하지만 지금은 그것이 우리가 사용하고 있는 것이고 새로운 영역을 탐색하려는 사용 사례에 대해 생각합니다. 00:38:14.990 --> 00:38:17.950 line:-4 position:50% align:center size:85% 그리고 관심을 가질만한 관련 논문을 식별하십시오. 00:38:19.840 --> 00:38:22.320 line:-4 position:50% align:center size:85% 우리는 이것이 실제로 정말, 정말 적절하다고 느낍니다. 00:38:24.0 --> 00:38:27.680 line:-4 position:50% align:center size:85% 요약을 생성하는 콘텐츠 검색을 제공하는 데 사용할 정보 원본입니다. 00:38:29.390 --> 00:38:30.510 line:-4 position:50% align:center size:85% 대. 고마워요, 에이드리언. 00:38:32.480 --> 00:38:47.400 line:-4 position:50% align:center size:85% 이제 상당히 일반적인 것에 대한 질문을 드리고, 저는 우리가 프레젠테이션에서 이것을 언급했다고 생각합니다. 그러나 대규모 언어 모델의 일반적인 문제, 예를 들어 문맥 이해의 부족 및 잘못된 정보의 생성과 같은 문제를 어떻게 해결할 수 있을까요? 00:38:50.510 --> 00:39:08.389 line:-4 position:50% align:center size:85% 그래, 내 말은, 잘 지내? 우리는 아마도 이것에 대해 함께 일할 수 있을 것입니다. 더 큰 모델과 맥락 이해 부족 및 일반적으로 잘못된 정보에 대한 일반적인 우려에 대한 최소한의 관점을 말씀드릴 수 있습니다. 네, 진짜 문제입니다. 나는 100을 할 수 있고 그것이 이것을 훌륭하게 수행한다고 주장하는 큰 평균 모델이 있다고 생각하지 않으며 그런 의미에서 우리도 다르지 않습니다. 그러나 우리가 할 수 있는 일은 사용 사례의 범위를 정말 좁은 범위로 좁히는 것입니다. 이 경우 한 가지 임무는 이 작업을 정말 잘 수행하는 것입니다. A 00:39:08.389 --> 00:39:26.269 line:-4 position:50% align:center size:85% I의 범위, Scopus에서 제공하는 콘텐츠를 보고 이 질문에 대한 응답이라고 생각되는 것을 생성하십시오. 00:39:26.830 --> 00:39:54.590 line:-4 position:50% align:center size:85% 우리가 개발한 사용 사례의 품질을 제어하고 개선하는 데 큰 도움이 됩니다. 현재로는. 그렇다고 해서 우리가 정보와 문맥 이해로부터 자유롭다는 것을 의미하지는 않지만, 우리는 이런 식으로 정보를 기초화하고 대규모 언어 모델에 자체 문맥을 삽입하도록 요구하지 않음으로써 환각과 같은 것의 위험을 크게 개선하거나 줄일 수 있다는 것을 알고 있습니다. 이러한 문제는 여전히 발생할 수 있으며 특정 정보를 매우 주의 깊게 확인해야 한다는 면책 조항이 있지만 이 접근 방식을 사용하면 크게 줄어듭니다. 00:39:57.190 --> 00:40:33.750 line:-4 position:50% align:center size:85% 감사합니다. 미안해요. 아뇨, 제 말은, 네, 에이드리언이 말한 것을 지지하기 위해서입니다. 따라서 우리의 책임 있는 접근 방식 중 일부는 특정 모델의 강점과 한계가 무엇인지, 특정 작업을 수행하기 위해 설계할 수 있는 시스템의 다양한 구성 요소에 어떤 유형의 모델이 가장 적합한지 등을 식별하는 것입니다. 그래서 저는 이것이 Scope S AI에 대해 취하고 많은 영역에서 대규모 언어 모델의 힘을 활용하는 방법으로 사용되는 접근 방식을 실제로 말해준다고 생각합니다. 00:40:34.140 --> 00:40:54.220 line:-4 position:50% align:center size:85% 벡터 검색이나 다른 유형의 검색과 같은 실제 테스트 정보 검색 도구처럼 정교하고 현존하거나 지식 그래프와 같은 것을 활용하여 문맥 이해와 관련된 대규모 언어 모델에 내재된 격차를 메울 수 있습니다. 00:40:55.660 --> 00:40:58.980 line:-4 position:50% align:center size:85% 네, 이제 좀 더 구체적인 질문인데요, 아주 세분화되어 있습니다. 00:41:01.310 --> 00:41:02.230 line:-4 position:50% align:center size:85% 그래서 에 대한 질문입니다. 00:41:04.270 --> 00:41:19.300 line:-4 position:50% align:center size:85% 리뷰 기사나 사설, 오피니언 기사, 순수 연구 기사 대 순수 연구 기사를 답변에 어느 정도까지 포함시키는지, 그리고 더 많은 것을 확보하기 위해 이를 통제할 수 있는 방법이 있습니까? 00:41:20.590 --> 00:41:21.550 line:-4 position:50% align:center size:85% 편향된 응답이 적습니다. 00:41:23.510 --> 00:41:36.830 line:-4 position:50% align:center size:85% 그러니까 이건 학계에서도 편견이 있다는 걸 말해주는 것 같아요, 그렇죠? 그리고 스쿠버 CIA는 우리가 가장 관련성이 높다고 생각하는 정보를 검색하는 측면에서 학계의 환경을 최대한 반영하도록 설계되었습니다. 00:41:38.700 --> 00:41:52.300 line:-4 position:50% align:center size:85% 현재 제품에서는 응답을 생성하는 데 사용할 콘텐츠 유형을 선택할 수 없습니다. 또한 의견 기사나 편지와 같이 다른 콘텐츠 유형보다 훨씬 더 편향될 수 있는 특정 콘텐츠 유형이 있다는 것도 알고 있습니다. 00:41:54.500 --> 00:41:58.300 line:-4 position:50% align:center size:85% 지금 우리는 아마도 집중하고 있을 것입니다. 00:42:00.350 --> 00:42:20.870 line:-4 position:50% align:center size:85% 콘텐츠 유형 목록을 가져오는 방법이지만 거의 대부분을 다룹니다. 나는 정말로 문자와 콘텐츠 유형 중 하나를 제외하는 유일한 것이라고 생각합니다. 내 머리 꼭대기는 기억이 나지 않아, 너한테 다시 연락해야겠어, 하지만 우린 해냈어. 그것은 검토에 있을 수도 있고 나중에 변경될 수도 있지만 의견이 아닌 사실에 입각한 지식이라고 생각하는 것을 기반으로 요약을 작성하려는 의도로 수행되었습니다. 00:42:21.620 --> 00:42:25.580 line:-4 position:50% align:center size:85% 다시 말하지만, 완전히 없애는 것은 아니지만 우리는 그것을 줄이기 위해 받아들이려고 노력하고 있습니다. 00:42:26.740 --> 00:42:32.600 line:-4 position:50% align:center size:85% 그거에요. 좋은 질문입니다. 나는 그것에 멋지게 이어지는 또 다른 질문이 있습니다. 00:42:33.590 --> 00:42:55.150 line:-4 position:50% align:center size:85% 매우 미묘한 질문이므로 전체를 읽겠습니다. 학문적 편견은 때때로 사회적 편견보다 더 미묘합니다. 예를 들어, 역사적으로 일정 기간 동안 뜨거운 주제가 학계의 목소리를 지배할 때 일부 연구 진전이 주목을 받기 어려울 수 있습니다. 다양한 관점과 역사적 진화의 풍요로움을 고려하여 어떻게 답을 얻을 수 있는지 궁금합니다. 어쩌면 인간의 피드백 학습을 통해서일 수도 있습니다. 00:42:56.140 --> 00:42:58.200 line:-4 position:50% align:center size:85% 누구든지 그것에 응답하는 데 관심이 있습니까? 00:43:00.500 --> 00:43:32.690 line:-4 position:50% align:center size:85% 예. 다시 말하지만, 그것은 단지 범위의 말뭉치를 반영한 것입니다. 모든 도메인에서 뜨거운 주제는 편집, 자문, 콘텐츠 선택, 자문 위원회를 거치면 법률 논문을 찾을 수 있다는 것입니다. 그러니까 그 수준에서, 그리고 그것은 정말로 인기가 있습니다, 예, 그것은 아마도 당신이 그것을 한다면 아마도 지배적일 것입니다 오늘 Scopus에서 검색해봐도. 그리고 벡터 검색에서도 발생할 수 있습니다. 내 말은, 우리가 지금 가지고 있는 사용 사례의 경우, 대부분 주제와 관련된 정보를 찾는 데 다시 초점을 맞추고 있습니다. 00:43:33.380 --> 00:43:48.620 line:-4 position:50% align:center size:85% 우리는 기준선 요약으로 할 수 있는 일이 너무 많다는 것을 알고 있으며, 이것이 예를 들어 반사 레이어의 경우 때때로 직접 호출하는 이유입니다. 만약 우리가 어떤 것을 생각한다면, 응답에 표현되지 않은 큰 그림이 있다면, 우리는 무언가가 빠졌다고 말하거나 이것이 하나의 관점을 불공평하게 대표하고 있다고 말할 수 있습니다. 지금 당장 CI의 범위로 들어가서 정말, 정말 편향된 질문이나 정말 구체적인 것을 쓸 수 있습니다. 그리고 넓은 시야 없이 뭔가를 되찾으려는 의도가 있다면, 이것이 우리가 확장된 요약과 같은 것을 가지고 있는 이유 00:43:48.620 --> 00:44:03.860 line:-4 position:50% align:center size:85% 입니다. 00:44:04.600 --> 00:44:25.420 line:-4 position:50% align:center size:85% 해당 쿼리를 사용하고 약간의 변형이 있는 다른 쿼리를 생성하여 보다 포괄적인 응답을 구축하는 데 도움이 되는 다른 관점을 고려합니다. 기본 환경으로 가져와야 하는지 여부를 조사하고 있습니다. 그리고 마지막으로 더 깊은 질문으로 사용자에게 주제에 대해 깊이 들어갈 수 있지만 고려해야 할 새로운 관점이 있을 수 있음을 교육하는 것이 중요합니다. 00:44:26.780 --> 00:44:47.660 line:-4 position:50% align:center size:85% 완벽한 해결책은 아니지만, 콘텐츠의 질, 초록 자체를 기반으로 사용자에게 관련 정보를 제공하고 있는지 확인하기 위한 조치를 취하고 있으며, 또한 두 세대 모두에게 다른 관점을 도입하고 연구 여정 동안 사용자 또는 연구자를 도울 수 있는 방법을 찾기 위한 조치를 취하고 있습니다. 00:44:49.300 --> 00:44:51.300 line:-4 position:50% align:center size:85% 여기에서도 우리가 할 수 있는 일이 훨씬 더 많을 것이라고 확신합니다. 00:44:53.400 --> 00:45:12.160 line:-4 position:50% align:center size:85% 그래서 우리는 여기서 AI 검색이 검색 범위와 나란히 위치할 것인지에 대한 질문이 있습니다. 따라서 Scopus AI 검색에 대한 시나리오는 특정 주제에 대한 기사를 찾는 Scopus의 현재 사용 사례와 완전히 동일하지 않습니다. 앞으로 이 두 가지 유형의 사용자를 어떻게 처리할 것인가? 그렇다면 2가지 형태의 검색은 어떻게 서로를 보완할까요? 00:45:13.790 --> 00:45:25.710 line:-4 position:50% align:center size:85% 나는 그것들이 매우 보완적이라고 생각합니다. 검색 범위를 살펴본 결과, 사용자의 6%가 새로운 주제 영역이나 이전에 못했던 것에 대해 알아보려고 검색 유형의 작업을 수행하고 있다는 것을 알게 되었습니다. 00:45:26.380 --> 00:45:57.620 line:-4 position:50% align:center size:85% 그리고 우리는 그것을 받아들였고 훨씬 더 쉽게 만들 수 있는 방법을 찾으려고 노력했습니다. 이제 이러한 유형의 작업에 대해 처음에는 일반적인 검색 범위인 Scopus로 직접 이동할 필요가 줄어들 수 있습니다. 그러나 우리의 의도는 그 도구를 대체하는 것이 아닙니다. 우리는 때때로 당신이 들어와서 조사를 할 때 매우 구체적인 용어를 원하거나 해당 분야가 제공해야 하는 모든 것을 원한다는 점에서 이러한 도구가 매우 보완적이라고 믿습니다. 00:45:57.820 --> 00:46:20.620 line:-4 position:50% align:center size:85% 그리고 Scuba CI는 어휘를 배우고 또 그 영역을 이해하기 위한 환상적인 도구로, 여러분이 그 단어와 대화하거나 그 정보를 가지고 매우 구체적인 어휘 유형 검색을 작성할 수 있습니다. 그래서 저는 그것이 매우 보완적이라고 생각하며, 장기적으로 추가 검색에 실제로 더 많은 혜택을 제공하기를 바랍니다. 00:46:22.810 --> 00:46:39.610 line:-4 position:50% align:center size:85% 대. 좋아, I 의 범위에 대한 답변을 생성 할 때 인용 계산의 사용에 대해 질문하십시오. 그래서 우리는 최고의 매치를 만들기 위해 그것들을 사용하지 않습니다. 이것이 조작될 수 있다는 우려가 있습니까? 모델은 한 분야 내에서 갈등과 논쟁을 어떻게 처리하나요? 00:46:42.800 --> 00:46:45.240 line:-4 position:50% align:center size:85% 네, 어떻게 얘기해야 할지 고민 중이에요. 00:46:48.700 --> 00:46:51.510 line:-4 position:50% align:center size:85% 내 질문을 다시 찾으려고, 더 자세히 읽으십시오. 00:46:53.150 --> 00:46:54.710 line:-4 position:50% align:center size:85% 도움이 된다면 천천히 다시 읽을 수 있습니다. 00:46:56.390 --> 00:47:10.910 line:-4 position:50% align:center size:85% 답변을 알려주는 제공된 인용은 단순히 인용 횟수에 영향을 미치는 것이 아니라 가장 일치하는 것을 선택한다고 말씀하셨습니다. 이것이 조작될 수 있다는 우려가 있습니까? 모델은 한 분야 내에서 갈등과 논쟁을 어떻게 잘 처리합니까? 00:47:11.500 --> 00:47:28.540 line:-4 position:50% align:center size:85% 내 말은, 특정 유형의 쿼리에 답하기 위해 완벽하게 작성된 초록을 작성하면 잠재적으로 조작 할 수 있습니다. 아마도 AI의 범위로 나타날 것입니다. 하지만 다시 말하지만, 만약 여러분이 그런 초록을 쓰고 있다면, 제 생각에는 더 큰 문제가 있다는 것입니다. 00:47:30.700 --> 00:47:41.190 line:-4 position:50% align:center size:85% 그렇게 생각하기 위해, 나는 이것이 오랫동안 검색의 문제였다고 생각합니다. 사람들은 검색 엔진에 의해 최적화되도록 제목과 초록을 작성할 수 있는 방법에 대해 생각해 왔습니다. 따라서 이것은 결코 새로운 것이 아닙니다. 00:47:41.780 --> 00:48:09.860 line:-4 position:50% align:center size:85% 그리고 우리의 희망은 사람들이 콘텐츠 전체 텍스트 자체 내에서 핵심 결과와 정보를 대표하는 고품질 초록을 계속 작성하는 것입니다. 그것이 아마도 Scopus AI에서 돈을 받기 위해 할 수 있는 가장 좋은 방법일 것입니다. 그리고 직접적으로 그것을 얻거나 조작하려는 사람들을 위해, 제 말은 우리가 콘텐츠 선정 자문 위원회를 두고 있는데, 이 자문 위원회는 다른 저널에서 들어오는 콘텐츠의 품질을 검토하는 데스크가 있고, 편집자들도 이것에 많은 관심을 기울이고 있습니다. 00:48:10.220 --> 00:48:25.200 line:-4 position:50% align:center size:85% 그래서 Scopus AI에서 이에 대한 위험을 줄이기 위해 최선을 다했다고 생각하지만 하이재킹될 수 있지만 초록이 이미 오랫동안 검색에 최적화되어 온 것과 같은 방식으로 파이가 되었습니다. 00:48:26.420 --> 00:48:29.380 line:-4 position:50% align:center size:85% 검색에 최적화된 초록에 대해 이야기합니다. 00:48:31.270 --> 00:48:39.830 line:-4 position:50% align:center size:85% 초록 내에서 관련 정보를 실제로 선택하는 방법에 대해 조금 말씀해 주시겠습니까? 키워드에 대한 의존입니까 아니면 어떻게 발생합니까? 00:48:41.590 --> 00:48:55.230 line:-4 position:50% align:center size:85% 그보다 더 미묘한 차이가 있습니다. 우리는 추상이 무엇인지에 대한 맥락을 이해하려고 노력하고 있습니다. 그래서 우리는 오픈 소스인 작은 언어 모델, 미니 LM 언어 모델을 사용하고 있습니다. 누구나 다운로드하여 가지고 놀 수 있습니다. 00:48:55.700 --> 00:49:26.220 line:-4 position:50% align:center size:85% 이 언어 모델이 벡터라고 불리는 것을 효과적으로 설명하기 위해 우리는 주제가 그것에 대해 이야기하는 것을 실제로 이해하려고 노력하고 이 수학적 벡터 공간에서 플롯을 그렸습니다. 개념화하기는 어렵지만 실질적으로 숫자 목록이며 유사한 키워드나 동일한 키워드를 찾고 이봐, 당신은 일치했고 당신은 그것들을 충분히 얻었다고 말하는 것이 아니기 때문에 다른 키워드 일치입니다. 그래서 당신은 이것이 작동하는 방식을 정말 높게 평가합니다. 우리가 이해하려고 하는 언어 모델은 요청된 질문과 직접 관련되거나 답변하는 정보가 있습니다. 00:49:27.700 --> 00:49:46.420 line:-4 position:50% align:center size:85% 이것이 현재 우리가 취한 접근 방식입니다. 그리고 정말 좋은 직업이 있다면, 특히 더 넓은 것을 볼 수 있는 직업을 찾을 수 있습니다. 자, 그거에는 한계가 있는데, 가끔은 아주 특정한 유형의 질의가 있을 수 있는데, 어쩌면 특정 유전자 이름이나 특정 이름을 언급했을 수도 있고, 어쩌면 전 세계에 몇 개의 논문만 있을 수도 있습니다. 00:49:47.910 --> 00:49:58.510 line:-4 position:50% align:center size:85% 지금 당장은 어려움을 겪을 수 있지만, 우리는 이 하나의 검색 메커니즘에 의존하는 것뿐만 아니라 다른 검색 메커니즘에도 대비할 수 있는 방법을 찾고 있습니다. 어쩌면 전통적인 검색 범위에서 두 세계의 장점을 모두 얻을 수 있습니다. 00:50:00.880 --> 00:50:24.280 line:-4 position:50% align:center size:85% 좋은 질문이고 해리가 여기서 다시 대화에 참여할 수 있기를 바라지만, 두 사람 모두에게 관련이 있을 것입니다. 대부분의 AI 시스템이 영어를 우선시한다는 점을 감안할 때, 다른 언어로 출판된 연구의 복잡성과 다양성을 어떻게 해결할 계획이며, 글로벌 연구의 보다 포괄적이고 포괄적인 범위를 보장하기 위해 어떤 전략을 고려하고 있습니까? 00:50:26.100 --> 00:50:33.820 line:-4 position:50% align:center size:85% 그는 그것을 원합니다. 좋은 질문이면서도 어려운 질문인데, 우리가 해야 할 일이 더 많다고 생각합니다. 00:50:35.750 --> 00:50:42.190 line:-4 position:50% align:center size:85% 이는 Scopus AI만의 문제가 아니며 또한 그렇습니다. 00:50:44.350 --> 00:50:47.510 line:-4 position:50% align:center size:85% 출판의 다양성 측면에서 더 광범위한 문제입니다. 00:50:49.270 --> 00:51:00.700 line:-4 position:50% align:center size:85% 한 가지 말씀드릴 수 있는 것은 학술 출판 전반의 다양성을 높이기 위한 우리의 노력과 이니셔티브에 관한 것입니다. 00:51:01.200 --> 00:51:08.100 line:-4 position:50% align:center size:85% 우리의 많은 작업, 심지어 책임 있는 AI 전략에 대한 작업도 외부로부터 정보를 얻습니다. 00:51:09.790 --> 00:51:12.270 line:-4 position:50% align:center size:85% 포용성 및 다양성 자문 위원회(Inclusion and Diversity Advisory Board). 00:51:13.950 --> 00:51:21.870 line:-4 position:50% align:center size:85% 예를 들어, 우리는 주변에서 데이터를 수집하기 시작하는 등 다양한 이니셔티브를 진행하고 있습니다. 00:51:23.420 --> 00:51:30.540 line:-4 position:50% align:center size:85% 성별, 인종 및 민족 및 제출 시스템을 사용하는 연구원의 보고. 그러니까 첫 번째, 첫 번째. 00:51:32.150 --> 00:51:48.270 line:-4 position:50% align:center size:85% 여정의 일부는 데이터를 수집하고 결과를 측정할 수 있는 것입니다. 그런 다음 우리는 서로 다른 그룹의 소득, 소득, 결과에 기여하는 시스템 내의 측면이 무엇인지 파헤치기 시작할 수 있습니다. 00:51:50.990 --> 00:51:53.110 line:-4 position:50% align:center size:85% 덧붙이고 싶은 말이 있나, 에이드리언, 아니면? 00:51:54.870 --> 00:52:13.470 line:-4 position:50% align:center size:85% 아니, 그것은 왕실, 해리가 언급했듯이 더 넓은 문제, 우리는 Scopus 내의 콘텐츠를 반영하고 그 콘텐츠가 처음 식별되고 수집되는 방법의 다양성에 대한 더 큰 질문의 반영이라는 측면에서 이야기합니다. 그래서 우리는 항상 그것을 개선하기 위한 지속적인 노력을 보면서 우리도 그것을 반영할 수 있을 것입니다. 00:52:14.660 --> 00:52:28.940 line:-4 position:50% align:center size:85% 굉장한. 네, 웨비나의 주제인 책임 있는 AI에 대한 질문에 초점을 맞추려고 하지만, AI로서 범위에 액세스하는 방법을 묻는 사람들이 불가피하게 있을 수 있습니다. 어떻게 사용할 수 있습니까? 00:52:30.430 --> 00:52:44.430 line:-4 position:50% align:center size:85% 그걸 가져가고 싶니, 에이드리언? 우리 모두가 명확하다는 것을 확실히 하기 위해서? 네, 물론입니다. 따라서 Scopus AI는 Scopus의 유료 애드온 모듈입니다. Scopus 1st가 필요하고 Scopus에는 그 위에 추가 기능이 있습니다. 00:52:44.900 --> 00:52:58.100 line:-4 position:50% align:center size:85% 관심이 있으신 분들은 강력히 추천드리자면, 이 웨비나에 첨부된 팜플렛과 리플렛을 읽어 보시고 현지 엘스비어 영업 담당자에게 연락하시면 도움을 드릴 수 있습니다. 00:52:59.260 --> 00:53:00.200 line:-4 position:50% align:center size:85% 대. 감사합니다. 00:53:02.390 --> 00:53:03.950 line:-4 position:50% align:center size:85% 여기서 우리가 가진 질문으로 돌아갑니다. 00:53:05.750 --> 00:53:11.430 line:-4 position:50% align:center size:85% Scopus AI가 얼마나 최신 상태인지는 어떻습니까? 그래서 그것은 a입니다. 여러 질문으로 구성된 질문이지만 먼저 이 부분을 알려드리겠습니다. 00:53:13.150 --> 00:53:18.710 line:-4 position:50% align:center size:85% 그렇다면 범위에 대한 결과는 내가 새로 출판 된 논문을 포함한다고 말합니까? 00:53:21.260 --> 00:53:40.820 line:-4 position:50% align:center size:85% 예, 건너 뛰기 CIA에는 2013 년의 콘텐츠가 포함되어 있으며 Scopus의 거울입니다. 따라서 Scopus는 매우 정기적으로 발생하는 새로운 콘텐츠를 가져오고 변경 사항이 하루에 수천 번 발생하므로 해당 콘텐츠는 범위 CI에 직접 반영됩니다. 그런 의미에서 그것은 현재의 Scopus를 최신의 관점에서 직접 반영합니다. 00:53:41.660 --> 00:54:02.620 line:-4 position:50% align:center size:85% 시원하다. 그리고 이 질문의 두 번째 부분은 실제로 필터 도입 가능성에 관한 것입니다. 그래서 우리는 결과, 주제, 영역 또는 인용 횟수 또는 기타 매개 변수별로 필터링하기 위해 필터를 추가하는 것에 대해 생각하고 있습니까? 그것이 우리가 고려하고 있는 것입니까, 아니면 아직 비전의 일부로 필터가 아닌가요? 00:54:04.260 --> 00:54:33.900 line:-4 position:50% align:center size:85% 그것은 검토되고 있는 것입니다. 필터와 관련하여 우리가 물어야 할 몇 가지 중요한 질문이 있다고 생각합니다. 예를 들어 인용 필터가 있습니다. 앞서 언급했듯이 가장 많이 인용된 것을 선택한다고 해서 최고의 응답을 얻을 수 있다는 보장은 없습니다. 쿼리에 답변하는 가장 무작위적인 정보가 있는 초록이 있는 문서의 우선 순위를 지정했습니다. 가장 잘 최적화 될 수있는 다른 유형의 솔루션이있을 수 있다고 생각하지만, 더 많은 권위를 가지고 찾고 있다면 사람들이 일반적으로 필터에서 원하는 것입니다. 00:54:34.140 --> 00:54:41.940 line:-4 position:50% align:center size:85% 재단 논문 기능은 주요 논문이 무엇인지 보여줄 수 있기 때문에 정말 유용합니다. 나는 아이디어를 알렸다. 00:54:43.390 --> 00:54:55.390 line:-4 position:50% align:center size:85% 그것은 우리가 그 요약을 작성하는 데 도움이 된 아이디어를 알리는 데 도움이 되었고, IE에는 요약을 작성하는 데 도움이 되도록 선택한 많은 논문이 있으며 우리는 그들이 거인의 어깨 위에 서 있는 전체에서 그 아이디어를 어디서 얻었는지 알아낼 수 있습니다. 00:54:57.270 --> 00:55:06.350 line:-4 position:50% align:center size:85% 현재 우리가 고려하고 있는 필터는 어떤 방식으로 나올지 확신할 수 없으며 사람들을 위해 해결하는 데 도움이 되는 문제가 무엇인지 더 잘 이해할 수 없습니다. 00:55:07.920 --> 00:55:08.680 line:-4 position:50% align:center size:85% 고마워, 애드리안. 00:55:10.550 --> 00:55:27.150 line:-4 position:50% align:center size:85% 해리, 사실 너한테 묻고 싶었던 게 하나 있는데, 네가 오늘 아침에 이것에 대해 정말 잘 얘기하는 걸 들었기 때문이야. 더 넓은 의미의 책임에 대해 생각해보면, Scopus AI와 LTV의 AI 활동의 친환경 자격 증명에 대해 조금 말씀해 주시겠습니까? 00:55:29.500 --> 00:55:55.620 line:-4 position:50% align:center size:85% 그리고 그들의 지속 가능성은 일부 사용자가 상당히 관심을 가지고 있는 것이기 때문입니다. 네, 정말 좋은 질문입니다. 이러한 모델의 훈련이 매우 계산 집약적이며 이와 관련된 상당한 탄소 영향이 있다는 사실을 아는 것은 누구에게도 놀라운 일이 아니라고 생각합니다. 00:55:57.150 --> 00:55:58.870 line:-4 position:50% align:center size:85% 그리고 그렇게. 00:56:00.480 --> 00:56:28.360 line:-4 position:50% align:center size:85% 네, 이는 업계가 여전히 고심하고 있는 과제입니다: 대규모 언어 모델에 대해 쿼리를 실행할 때의 탄소 영향과 같은 영향을 정량화하는 방법에 대한 메트릭을 배치하는 방법, 현재 우리가 구독하는 LLM에 들어간 교육의 탄소 영향을 어떻게 전달할 수 있는지. 그리고 이 주제에 대한 규제 당국에서도 명확성이 나오기 시작할 것이라고 생각합니다. 00:56:30.180 --> 00:57:04.140 line:-4 position:50% align:center size:85% 엘스비어의 경우, 지난 몇 년 동안 AI 및 데이터 사이언스 시스템을 포함한 많은 애플리케이션을 클라우드 기반 인프라로 이전하고 자체 데이터 센터를 폐쇄함으로써 상당한 양의 탄소 배출량을 줄였습니다. 그러니까 아드리안이 GPT 모델을 AI와 마이크로소프트 등 범위의 일부로 사용하는 것에 대해 언급했고, 우리가 사용하는 다른 공급자들도 재생 에너지와 재생 에너지 구매에 상당한 투자를 했습니다. 00:57:05.380 --> 00:57:20.460 line:-4 position:50% align:center size:85% 제 말은, 이러한 배출량이 조직으로서의 전체 발자국의 일부라는 점도 지적해야 합니다. 예를 들어, 그 중 대다수는 실제로 인쇄된 상태로 남아 있다고 생각하지만, 우리는 이를 진지하게 받아들입니다. 00:57:21.990 --> 00:57:37.190 line:-4 position:50% align:center size:85% 우리는 그것에 접근하는 가장 좋은 방법을 알아내고 있지만, 그것은 또한 우리의 의사 결정에 확실히 통합되는 것입니다. 예를 들어, 알고리즘 영향 평가의 일환으로 우리는 이러한 탄소 집약적인 처리 또는 모델을 사용하고 있는지 여부를 반영합니다. 00:57:38.180 --> 00:57:39.380 line:-4 position:50% align:center size:85% 모든 종류의 대부분. 00:57:41.710 --> 00:57:54.430 line:-4 position:50% align:center size:85% 효율적이거나 가장 영향력 있는 사용 사례. 예를 들어, 우리는 경솔한 트윗을 작성하거나 저녁 식사 레시피를 생성하기 위해 탄소를 내뿜고 싶지 않습니다. 00:57:56.230 --> 00:58:03.190 line:-4 position:50% align:center size:85% 그래서 우리가 다루고 있는 사용 사례는 연구자, 학계, 임상의, 등등을 지원하는 측면에서 다루고 있습니다. 00:58:04.870 --> 00:58:09.670 line:-4 position:50% align:center size:85% 제 생각에는 비용과 편익의 균형이라고 생각합니다. 00:58:10.220 --> 00:58:15.100 line:-4 position:50% align:center size:85% 그리고 시스템을 최적화하고 최대한 효율적으로 만들 수 있는 방법을 찾고 있습니다. 00:58:17.470 --> 00:58:29.990 line:-4 position:50% align:center size:85% 감사. 어떻게 지내세요? 그것은 중요한 것입니다. 여기에 아주 기본적인 것이 있지만 물어볼 필요가 있다고 생각합니다. 엘스비어 외부의 기사에서 발췌한 답변을 작성한다고 말할 수 있습니까? 엘스비어 말뭉치에 의존하는 것일까요, 아니면 그냥 그렇습니까? 그 이상입니까? 00:58:32.200 --> 00:58:37.780 line:-4 position:50% align:center size:85% Scopus는 말뭉치로 교차 출판사이므로 물론 다른 곳에서만 콘텐츠를 제공하는 것은 아닙니다. 00:58:40.260 --> 00:58:58.540 line:-4 position:50% align:center size:85% 화려한. 여기에 내가 피하고 있는 것이 하나 있는데, 그것은 그것이 보이기 때문에 피하고 있습니다. 내가 이것을 완전히 이해했는지 잘 모르겠지만 여러분 중 한 명은 이해할 수 있습니다. 체계적인 문헌고찰 질문이라 조금 전문적일 수 있지만, AI와 Scopus는 어떨까요? 00:59:00.190 --> 00:59:04.590 line:-4 position:50% align:center size:85% 특히 체계적인 문헌고찰에서 정밀도 슬래시 재현율에 영향을 미칩니다. 00:59:06.590 --> 00:59:11.790 line:-4 position:50% align:center size:85% 두 분 모두 체계적인 문헌고찰을 잘 이해하고 계신지 잘 모르겠습니다. 00:59:12.500 --> 00:59:14.660 line:-4 position:50% align:center size:85% 그 질문에 충분히 감사드립니다. 00:59:16.740 --> 00:59:22.300 line:-4 position:50% align:center size:85% 제 말은, 이것에 대해 조금 얘기할 수 있습니다. 제 말은, 우리가 구축한 것은 체계적인 문헌고찰을 대체하기 위해 고안된 것이 아니라는 것입니다. 00:59:23.870 --> 00:59:36.910 line:-4 position:50% align:center size:85% 그것은 도메인에 서 있는 것보다 더 많은 것을 필요로 하는 노동 집약적인 작업이며, 무엇이 바뀌었고 어떻게 바뀌었는지, 지금 당장 주제가 어떻게 생겼는지 이해하기 위해 많은 주기적인 작업이 필요합니다. 00:59:38.670 --> 00:59:45.830 line:-4 position:50% align:center size:85% 떠오르는 것, 일관성 있는 것, 그리고 그것은 우리가 하고 있는 것이 아닙니다. 우리는 당신이 더 나은 것을 이해하는 데 도움이 되도록 영역의 스냅샷을 만들려고 합니다. 00:59:46.220 --> 01:00:05.900 line:-4 position:50% align:center size:85% 그리고 그 주변에서 기술과 지식을 쌓으십시오. 이제 확장된 요약은 체계적인 검토를 향해 약간 나아가고 있는데, 그 이유는 아마도 그것을 작성하는 데 도움이 되는 더 다양한 관점과 의견을 얻으려고 노력한다는 것입니다. 그러나 그것은 결코 동등하지 않습니다. 어쩌면 미래에는 누가 알겠어, 하지만 지금 당장은 그게 우리의 목표가 아니야. 01:00:07.620 --> 01:00:16.820 line:-4 position:50% align:center size:85% 고마워 애드리안. 그래서 그것이 마지막 질문이 되어야 할 것입니다, 왜냐하면 우리는 이제 막 때가 되었기 때문입니다. 여러분 모두에게 유용하고 흥미로운 웨비나가 되었기를 바랍니다. 01:00:18.430 --> 01:00:28.470 line:-4 position:50% align:center size:85% 여기서 중요한 것은 이 분야가 새롭고 흥미로운 분야이지만 많은 사람들이 환각과 편견 등과 같은 분야에 대해 우려하고 있다는 것입니다. 01:00:29.740 --> 01:00:45.420 line:-4 position:50% align:center size:85% 그리고 우리는 책임감 있는 AI를 실행에 옮기기 위해 최선을 다하고 있으며, 이 자리에서 논의하는 것처럼 가능한 한 개방적인 태도를 취하고 있습니다. 그렇게 할 수 있도록 도와주셔서 감사합니다. 나는 당신이 제공 한 설득력있는 질문을 보는 것을 정말 좋아했습니다. 01:00:46.910 --> 01:00:51.310 line:-4 position:50% align:center size:85% 해리와 에이드리언에게도 감사의 인사를 전합니다. 01:00:53.300 --> 01:01:01.270 line:-4 position:50% align:center size:85% AI로서의 범위에 대해 자세히 알아보려면 유인물 및 유인물 탭을 확인하세요. 친근한 이웃인 Scopus Rep과 대화하십시오. 01:01:02.500 --> 01:01:26.500 line:-4 position:50% align:center size:85% 또는 3월 26일 날짜를 찾을 수 있도록 다음 웨비나에 참여할 수도 있습니다. 따라서 신뢰할 수 있는 정보를 얻을 수 있습니다. 몇 초 후에 이 웨비나 엔진이 작동할 때 여러분을 만나게 될 것입니다. 그러니 다시 한 번 참가해 주세요. 오늘 만나 뵙고 싶습니다. 조심하세요. 안녕히. 모두 감사합니다. 감사. 잘가요.