Apple은 새로운 AI 훈련 전략으로 사용자 데이터를 활용해 AI 성능을 향상시키고자 합니다. 차별적 프라이버시를 통해 사용자의 데이터를 안전하게 분석하며, 합성 데이터와 결합해 모델을 개선합니다. 이는 iPhone 등에서 Apple Intelligence 기능의 경험을 개선하기 위한 전략입니다.
(이미지 제공: Future)
지금까지 Apple Intelligence는 그리 좋은 한 해를 보내지 못했지만, Apple이 포기하고 있다고 생각한다면 오산입니다. Apple은 AI 성능을 크게 향상시킬 수 있는 새로운 모델 훈련 전략과 함께 큰 계획을 세우고 이를 추진하고 있습니다. 다만, 이러한 변화는 사용자가 선택할 경우 자신의 데이터를 좀 더 면밀히 살펴보는 것을 포함합니다.
Apple의 머신 러닝 연구에서 나온 새로운 기술 문서, “차별적 프라이버시를 이용한 Apple Intelligence의 집계 경향 이해”에서는 Apple Intelligence 특징들 뒤에 있는 모델을 더 잘 훈련하기 위해 데이터 분석을 사용자 데이터 및 합성 데이터 생성과 결합하는 새로운 계획을 설명했습니다.
일부 실제 데이터
현재까지 Apple은 모델을 완전한 합성 데이터로 훈련해왔습니다. 합성 데이터는 실제 데이터를 모방하려 하지만 한계가 있습니다. 예를 들어, Genmoji의 경우 Apple이 사용하는 합성 데이터는 실제 사용자가 시스템과 어떻게 상호작용하는지 항상 나타내지는 않습니다. 문서에서는 다음과 같이 설명합니다:
당신이 좋아할 수도 있는 콘텐츠
“예를 들어, 사용자가 여러 개의 엔티티를 포함하는 Genmoji(예: ‘카우보이 모자를 쓴 공룡’)를 요청할 때 모델이 어떻게 작동하는지를 이해함으로써 이러한 요청에 대한 응답을 개선할 수 있습니다.”
기본적으로 사용자가 선택하면 시스템은 장치가 데이터 세그먼트를 본 적이 있는지 조사할 수 있습니다. 그러나 사용자의 휴대폰은 실제 데이터가 아닌, 소음이 많고 익명화된 신호를 보냅니다. 이는 Apple의 모델이 학습하기에 충분한 것으로 보입니다.
문자열 도구 및 요약과 같은 긴 텍스트와 함께 작동하는 모델의 경우, 과정이 약간 다릅니다. 이 경우, Apple은 합성 모델을 사용한 후, 데이터 분석에 동의한 사용자에게 이러한 합성 모델의 표현을 보냅니다.
장치에서는 시스템이 이러한 표현을 최근 이메일의 샘플과 비교하는 비교를 수행합니다.
“가장 많이 선택된 합성 임베딩은 훈련 또는 시험 데이터를 생성하는 데 사용될 수 있으며, 추가적인 큐레이션 단계를 실행하여 데이터 세트를 더욱 정제할 수 있습니다.”
더 나은 결과
상당히 복잡한 내용입니다. 그러나 핵심은 Apple이 모든 사용자 데이터에 차별적 프라이버시를 적용한다는 점입니다. 이는 데이터에 소음을 추가하여 그 데이터를 실제 사용자와 연결할 수 없도록 만드는 과정입니다.
그러나 Apple의 데이터 분석에 동의하지 않으면 이 모든 것은 작동하지 않습니다. 이는 주로 iPhone, iPad 또는 MacBook을 처음 설정할 때 발생합니다.
이렇게 해도 데이터나 프라이버시가 위험에 처하지는 않지만, 그러한 훈련은 더 나은 모델로 이어지고, 궁극적으로 iPhone 및 기타 Apple 기기에서의 Apple Intelligence 경험을 개선해야 합니다.
또한 더 스마트하고 합리적인 재작성 및 요약을 의미할 수도 있습니다.
당신이 좋아할 수도 있는 콘텐츠
※출처: TechRadar