
Siri의 개인 정보 보호 기능 개선
Apple은 개인 정보 보호가 기본적인 인권이라고 생각합니다. 우리는 우리의 제품이 사용자의 개인적인 데이터를 보호하도록 설계하고 이러한 보호 기능을 강화하기 위해 지속적으로 노력하고 있습니다. 이는 우리의 서비스에 대해서도 마찬가지입니다. 선구적인 지능형 가상비서 서비스인 Siri와 관련해 우리는 고객의 개인 정보를 긴밀히 보호하면서도 고객을 위해 최고의 경험을 제공하는 것을 목표로 하고 있습니다.
우리가 그레이딩(grading)이라고 부르는 Siri 품질 평가 과정의 한 부분으로써 Siri 녹음 내용을 청취하는 것에 대한 최근 보도로 인해 고객분들이 우려하고 계신다는 것을 우리는 알고 있습니다. 우리는 고객들의 우려사항을 접하고, Siri 요청사항들과 관련해 사람이 그레이딩하는 작업을 즉시 중단했으며, 우리의 관행 및 정책에 대한 철저한 검토 작업에 돌입했습니다. 그 결과 Siri에 몇 가지 변경 사항을 적용하기로 결정했습니다.
Siri가 개인 정보를 보호하는 방법
Siri는 처음 설계부터 사용자 개인 정보를 보호하도록 제작됐습니다. 우리는 가능한 한 기기 내에서 많은 것을 하는 것에 초점을 맞춰, Siri를 통해 수집하는 데이터의 양을 최소화하고 있습니다. Siri 데이터를 우리의 서버에 저장할 때, 우리는 해당 데이터를 마케팅 프로파일의 구축을 위해 사용하지 않으며 결코 타인에게 판매하지 않습니다. 우리는 Siri 데이터를 오직 Siri를 개선하기 위해 사용하며, Siri의 개인 정보 보호를 강화시켜주는 기술들을 지속적으로 개발하고 있습니다.
Siri는 정확한 결과를 제공하기 위해 가능한 한 데이터를 거의 사용하지 않습니다. 예를 들어, 스포츠 행사에 대해 질문하는 경우, Siri는 적합한 결과를 제공하기 위해 일반적인 위치 데이터를 사용합니다. 그러나 가장 가까운 식료품점을 묻는다면 보다 구체적인 위치 데이터가 사용됩니다.
Siri에게 읽지 않은 메시지를 읽도록 요청하는 경우, Siri는 단순히 기기가 읽지 않은 메시지를 소리내어 읽도록 지시를 내립니다. 메시지의 내용은 요청을 이행하는 데 필요하지 않기에 Siri의 서버로 전송되지 않습니다.
Siri는 데이터가 처리되고 있는 동안 데이터의 추적을 위해 Apple ID나 전화번호를 통해 데이터를 개인의 신원과 연계하기보다는 단일 기기에 관련된 글자 및 숫자의 긴 문자열인 무작위 식별자를 이용하는데, 이는 현재 이용되고 있는 디지털 가상비서 서비스들 중 차별화된 과정이라고 생각하고 있습니다. 보호 기능을 더 강화하기 위해, 6개월 뒤엔 무작위 식별자와 기기 데이터 간 연결이 해제됩니다.
iOS에서 설정 > Siri 및 검색 > Siri에게 요청하기 및 개인 정보 보호에 관하여로 들어가면 Siri가 접근하는 데이터와 처리 과정에서 우리가 사용자의 정보를 보호하는 방법에 대한 자세한 설명이 제공됩니다.
사용자의 데이터로 Siri를 개선시키는 방법
Siri는 개인화된 과제를 보다 정확하게 완수하기 위해 기기로부터 특정 정보를 수집하고 저장합니다. 예를 들면, Siri가 흔하지 않은 이름을 접하게 되면, 해당 이름을 올바르게 인식하는 지를 확인하기 위해 연락처의 이름을 사용할 수도 있습니다.
Siri는 또한 사용자가 Siri와의 상호작용을 통해 생긴 데이터에 의존합니다. 여기에는 요청사항의 오디오와 컴퓨터로 생성된 해당 오디오의 전사 자료가 포함됩니다. Apple은 Siri를 개선하기 위해 “트레이닝”하는 머신 러닝 과정에서 종종 요청사항의 녹음 내용과 전사 자료를 사용합니다.
그레이딩 작업을 중단하기 전, 우리의 처리 과정에는 Siri가 얼마나 제대로 대응하는 지를 측정하고 안정성을 개선시키기 위해 Siri 요청사항의 일부 오디오 샘플(0.2% 미만)과 컴퓨터로 생성된 해당 오디오의 전사 자료를 검토하는 작업이 수반되었습니다. 예를 들면, 사용자가 Siri를 깨우려는 의도가 있었는가? Siri가 해당 요청사항을 정확하게 들었는가? 그리고 Siri가 해당 요청사항에 적절히 대응했는가? 등입니다.
변경 사항
검토 결과, 우리는 우리의 높은 이상에 충분히 부응하지 못했음을 깨닫고 있으며, 이에 사과드립니다. 앞서 발표한 바와 같이, 우리는 Siri 그레이딩 프로그램을 중단했습니다. 이는 소프트웨어 업데이트가 이용자들에게 제공되는 올해 늦가을 시점에 다음의 변경 사항들을 먼저 적용한 이후 재개할 계획입니다.
- 첫째, 무조건적으로, Siri와의 상호작용 과정에서 생성된 오디오 녹음 자료는 더 이상 보관되지 않을 것입니다. Siri의 개선 작업을 도울 수 있도록 컴퓨터로 생성된 전사 자료는 계속해서 사용할 것입니다.
- 둘째, 사용자는 본인 요청사항에 대한 오디오 샘플로부터의 학습을 통해 Siri의 개선작업을 돕겠다는 동의 여부를 선택할 수 있게 될 것입니다. 우리는 많은 분들이 Apple이 사용자의 데이터를 존중하고 강력한 개인 정보 보호 관리를 적용하고 있음을 알고 Siri의 개선을 돕겠다고 선택하시길 바라고 있습니다. 참여하기로 선택한 분들은 언제든 참여를 취소할 수 있습니다.
- 셋째, 고객이 참여를 선택하는 경우, Apple 직원들에게만 Siri와의 상호작용 과정에서 생성된 오디오 샘플 청취가 허용될 것입니다. 의도하지 않게 Siri를 호출한 것으로 판단되는 녹음 자료는 삭제하도록 할 것입니다.
Apple은 고객의 개인 정보 보호를 포함해 우리가 하는 모든 행동의 중심에 고객을 두고자 노력하고 있습니다. 우리는 고객이 개인 정보에 대한 자신의 권한을 손상시키지 않고 하고자 하는 바를 빠르고 쉽게 해낼 수 있도록 돕기 위해 Siri를 개발했습니다.

Siri 개인 정보 보호 및 그레이딩
Apple은 Siri의 품질을 평가하는 과정의 일환으로 Siri의 음성 녹음을 듣는 사람들이 있다는 최근 보도로 인해 고객이 우려하고 있음을 인지하고 있습니다. Apple은 고객의 우려 사항을 듣자마자 사람이 직접 진행하는 Siri 요청의 그레이딩 작업을 즉시 중단했으며, 당사의 절차 및 정책을 철저하게 검토하기 시작했습니다. 그 결과, Siri에 몇 가지 변경 사항을 적용하기로 결정하였으며 변경 사항을 반영한 소프트웨어 업데이트는 올가을에 출시될 예정입니다. 이 변경 사항에 대한 자세한 내용은 이 Apple Newsroom 게시물에서 확인하실 수 있습니다.
또한 Siri 개인 정보 보호 및 그레이딩에 대한 몇 가지 일반적인 질문과 답변을 아래에서 확인하실 수 있습니다.
그레이딩(Grading)이란 무엇입니까?
그레이딩을 중단하기 전까지 당사의 절차에는 Siri의 응답성을 측정하고 안정성을 향상하려는 목적으로 Siri 요청에 사용된 음성 중 소량의 샘플(0.2% 미만)과 컴퓨터에서 생성된 대화 기록을 검토하는 과정이 포함되어 있었습니다. 예를 들어 사용자는 Siri를 깨울 의도가 있었는가? Siri가 정확하게 요청을 알아들었는가? Siri가 요청에 적절하게 응답했는가? 등을 검토했습니다. Siri 요청에서 얻은 소량의 샘플에 그레이딩을 진행하면 시간이 지남에 따라 Apple은 Siri의 성능을 크게 개선하여 Siri를 이용하는 전 세계의 고객에게 최상의 경험을 제공할 수 있게 됩니다.
다른 인공 지능 보조 기능과 비교하여 Siri의 개인 정보 보호 정책은 어떻게 다릅니까?
Apple은 개인 정보 보호가 모든 사람의 기본 권리라고 믿습니다. Apple은 사용자의 개인 데이터를 보호하도록 제품을 설계하고 이러한 보호 기능을 강화하기 위해 끊임없이 노력하고 있습니다. 이것은 Apple이 제공하는 서비스에서도 마찬가지입니다.
Apple이 Siri를 통해 이루고자 하는 목표는 고객의 개인 정보를 방심하지 않고 보호하면서 고객에게 최상의 경험을 선사하는 것입니다. Apple은 고객이 기기의 설정을 변경하지 않아도 기본적으로 음성 녹음과 관련된 개인 정보가 보호되어야 한다고 생각합니다. Apple의 고객은 Siri의 성능 개선에 도움이 될 수 있도록 본인의 음성 정보를 공유할지의 여부를 스스로 선택할 수 있어야 합니다.
Siri는 처음부터 사용자의 개인 정보를 보호하도록 설계되어 있습니다. Apple은 개인 정보 수집에 의존하는 방식으로 사업을 운영하지 않기 때문입니다. Apple은 최소한의 데이터로 우수한 서비스를 제공하고 가능한 한 기기에서 이러한 데이터(Siri 요청을 포함)를 처리하기 위해 노력하고 있습니다.
Siri는 데이터를 처리하는 동안 임의의 식별자(문자와 숫자로 구성된 긴 문자열로 단일 기기와 연결되어 있음)를 사용하여 각 데이터를 추적하며, 사용자의 Apple ID나 전화번호를 통해 사용자의 ID에 연결하지 않습니다. 이 방식은 오늘날 사용되는 인공 지능 보조 기능 중에서 Siri에만 적용된 유일한 방식이라고 생각합니다. 또한 더욱 강력한 정보 보호를 위해 6개월이 지나면 기기의 데이터와 임의 식별자의 연결이 해제됩니다.
Siri가 접근하는 데이터에 대한 세부 사항 및 이러한 과정에서 Apple이 사용자의 정보를 보호하는 방법은 iOS의 설정 > Siri 및 검색 > Siri에게 요청하기 및 개인 정보 보호에 관하여에서 확인하실 수 있습니다.
Siri가 항상 듣고 있습니까? “Siri야”라고 말한 경우가 아닐 때 Siri가 음성을 듣지 않도록 하려면 어떻게 해야 합니까?
아니요. Siri는 “Siri야”라고 말하여 기기를 실행하거나, Apple Watch의 들어서 말하기 기능을 사용하거나, iPhone, iPad, Mac, Apple Watch, Apple TV, AirPods 및 HomePod에서 지정된 버튼을 사용하여 물리적으로 Siri를 실행하는 경우에만 Siri 기능이 활성화되고 Apple에 음성을 보내도록 만들어졌습니다
“Siri야”를 인식하기 위해 Apple은 해당 음성이 “Siri야” 패턴과 일치하는지 판단할 수 있도록 여러 분석 단계를 통해 음성을 처리하며 이 작업은 기기에서만 수행됩니다. 기기에서 “Siri야” 패턴이 인식된 경우에만 사용자의 음성이 서버로 전송됩니다. 또한 서버에서도 추가적인 절차를 통해 전체 음성 요청을 분석하여 음성에 Siri를 부르려는 의도가 있는지 확인합니다.
경우에 따라 의도하지 않았는데 Siri가 활성화될 수 있습니다. Apple은 이러한 현상을 ‘잘못된 실행’이라고 부릅니다. Apple은 잘못된 실행을 최소화하기 위해 노력하고 있으며, 그레이딩 수행자가 이러한 요청에 최대한 노출되지 않도록 검토 절차를 업데이트하였습니다. 그레이딩을 다시 재개하면 Apple 팀에서는 Siri가 잘못 실행되었다고 판단되는 모든 녹음을 삭제하는 작업을 수행하게 됩니다.
검토자가 접근할 수 있는 데이터의 양을 최소화한다고 했는데, 이것은 어떤 의미입니까? 검토자가 계속해서 들을 수 있는 정보는 무엇입니까?
Apple은 인적 그레이딩 절차를 변경하여 검토자가 접근할 수 있는 데이터의 양을 더욱 최소화하려고 합니다. 담당자가 해당 업무를 효과적으로 수행하는 데 필요한 데이터만 확인할 수 있도록 하기 위함입니다. 예를 들어 홈 앱에서 설정한 기기 및 방의 이름은 가정 내 기기 제어와 관련된 요청을 그레이딩하는 경우에만 검토자가 접근할 수 있습니다.
Siri에게 연락처, 개인 플레이리스트 이름, 홈 앱에서 설정한 방과 기기의 이름 등 사용자 정보에 대한 접근 권한이 필요한 이유는 무엇입니까? Apple에서 사용자를 식별하거나 사용자의 HomeKit 기기를 제어할 수 있습니까?
Siri는 맞춤형 작업을 더욱 정확하게 수행하기 위해 기기에서 특정 정보를 수집하고 기기에 저장합니다. 예를 들어 Siri는 흔하지 않은 이름을 들으면 연락처의 이름을 사용하여 이름을 제대로 인식하려고 할 수 있습니다. Siri가 접근하는 데이터에 대한 세부 사항 및 이러한 과정에서 Apple이 사용자의 정보를 보호하는 방법은 iOS의 설정 > Siri 및 검색 > Siri에게 요청하기 및 개인 정보 보호에 관하여에서 확인하실 수 있습니다.
Siri는 최소한의 데이터로 정확한 결과를 제공합니다. 예를 들어 사용자가 스포츠 경기에 대한 질문을 하면 Siri는 사용자의 대략적인 위치 정보를 사용하여 그에 맞는 결과를 제공합니다. 그러나 가장 가까운 식료품점을 알려 달라고 요청하는 경우에는 더욱 구체적인 위치 데이터가 사용됩니다.
Siri에게 확인하지 않은 메시지를 읽어 달라고 요청하는 경우 Siri는 확인되지 않은 메시지를 소리 내어 읽는 작업만 기기에 지시합니다. 메시지 내용은 요청을 수행하는 데 필요하지 않으므로 Siri의 서버로 전송되지 않습니다.
그레이딩은 누가 수행합니까?
고객이 정보를 공유하기로 선택한 경우 Apple 직원만 사용자와 Siri가 나눈 대화의 샘플을 들을 수 있게 됩니다. 담당 팀에서는 Siri가 잘못 실행되었다고 판단되는 모든 녹음을 삭제하는 작업을 수행합니다.
공유하기로 선택하지 않은 고객의 대화 기록을 보관하는 이유는 무엇입니까?
컴퓨터에서 생성된 대화 기록은 Siri의 성능 및 안정성 향상 목적으로 사용됩니다. 이러한 대화 기록은 Siri의 성능을 향상하고, 일반적인 사용 패턴을 파악하고, 언어 및 이해 모델을 업데이트할 수 있도록 머신 러닝 교육에 사용됩니다. 또한, 대화 기록은 Siri의 안정성과 관련하여 심각한 문제를 해결하는 경우에도 사용될 수 있습니다.
Siri가 사용자의 음성 녹음 및 대화 기록을 보관하지 않도록 하는 유일한 방법은 Siri를 비활성화하는 것뿐입니까?
2019년 가을에 출시되는 소프트웨어 업데이트를 시작으로 향후에는 기본적으로 사용자의 Siri 요청 음성이 보관되지 않습니다. 컴퓨터에서 생성된 사용자의 음성 요청 대화 기록은 Siri의 성능 향상을 목적으로 사용될 수 있습니다. 이러한 대화 기록은 사용자의 Apple ID가 아니라 임의의 식별자와 연결되며, 연결 유지 기간은 최대 6개월입니다. Siri 음성 녹음의 대화 기록을 보관하지 않으려면 설정에서 Siri 및 받아쓰기를 비활성화하면 됩니다.
자세한 정보 : Siri 개인 정보 보호 및 그레이딩(Grading)
https://www.apple.com/kr/newsroom/2019/08/improving-siris-privacy-protections/
KMUG 애플에 대한 모든 것.
케이머그 김영권
https://kmug.com
KMUG 케이머그에서 더 알아보기
구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.