차세대 인터넷 P2P

from Book/읽은 책 2009/03/03 10:06 view 27887
차세대 인터넷 P2P
팀 오라일리 공저/앤디 오람 편/전형성 공역

2000년 책이지만 P2P 의 전반적인 이야기를 여러명이서 해주는 책으로 나름 대가들의 이야기를 들을 수 있다. ㅜ_ㅜ 어렵다..


위치라는 관념을 버리게 할 중요한 개념으로 도약할 시간이 다가옴.  - 13

"어떻게 일반적인 개인 사용자들을 믿을 수 있지요?"  - 15

인터넷은 전세계에 퍼져 있는 수백만 호스트들로 이루어진 협력 네트워크로 볼 수 있으며 공유된 자원이라 할 수 있다. - 25


네트워크를 사용할 수 있다는 의미는 대역폭을 소비 한다는 의미이다. - 25

대역폭 : 일정 시간 내에 어떤 특정한 회선을 통해 전송할 수 있는 정보의 양을 말한다.


인터넷 아키텍처에 책임성이라는 것이 부족하다. 어떤 호스트라도 다른 호스트에 연결할 수 있고, 신원을 확인할 수 없는 익명에 가까운 상태로 연결하기 때문이다. - 39


인터넷 설계의 기본 원칙은 "최대 노력(Best Effort)" 패킷 전달이다.-40

Best Effort : 인터넷이 모든 패킷을 확실히 전달할 수 있다는 보장은 없지만 패킷이 목적지에 도착하도록 최대한 노력할 것이라는 의미.


인터넷이 상업화 되면서 "공유지의 비극(tragedy of the commons)" 에 민감하다. 허용하는 대역폭 이상을 이용하는 프로토콜을 사용하여 불공평하게 많은 대역폭을 사용할 뿐만 아니라 모든 이들을 위한 공동 자원을 독점하여 인터넷에 혼란을 가져 올 수 있다. - 41

공유지는 한 무리의 사람들이 공유하는 자원(어떤 것이라도)을 일컫는다. 공유지의 비극이란 각자가 자신의 이익을 먼저 생각하기 때문에 공유하고 있는 자원이 모두 없어질 때까지 그것을 남용한다는 것이다. - 457


방화벽, 동적 IP, NAT는 인터넷 아키텍처를 확장성 있고 안전한 시스템으로 만드는데 필요하다는 요구 속에서 상장하였다. 그리고 이것들은 수백만 클라이언트 컴퓨터들을 쉽게 관리할 수 있게 해주고 인터넷에 빨리 연결할 수 있게 해주었다. 하지만 이런 기술은 대부분의 컴퓨터를 클라이언트 역할만 하는 이유로 전락시켜 인터넷의 하부 구조 자체를 약하게 만들었다. - 45


데이터 전송에 비용이 많이 드는 P2P시스템에서는 "가벼운 중앙 집중(soft centralization)"형태가 적합하다. - 49


분산화는 낮은 신뢰성, 부정확한 데이터 동기화(synchronization) 같은 문제를 유발시킨다. - 51


방화벽이 하나의 포트라도 허용되는 이상 P2P 애플리케이션들은 그 구멍을 슬그머니 지나갈 방법을 계속 찾을 것이다. - 52


P2P 네트워킹을 어렵게 만드는 요인들 -  52

방화벽은 호스트들간의 접속을 어렵게 함. - 방화벽을 더 영리하게 만들어서 P2P 애플리케이션이 방화벽과 협력하여 관리자가 원하는 패킷을 허용할 수 있게 해야 한다.

동적 IP와 NAT는 호스트들 간의 접속을 거의 불가능하게 함. - IPv6 128비트 주소 체계를 사용하여 모든 호스트들이 영구적인 주소를 가지도록 한다.

초고속 인터넷의 비대칭 대역폭은 P2P 시스템에서 공유 파일을 효율적으로 제공하기 어렵게 함. - 데이터 캐싱과 대역폭 관리를 할 수 있도록 한다.


P2P인지 아닌지 확인할 기준 - 60

일시적인 네트워크 주소와 다양한 연결을 지원할 수 있는가?

네트워크의 가장자리에 있는 노드의 자율권을 확실하게 보장해줄 수 있는가?

서비스를 제공하는 측의 하드웨어를 누가 소유하고 있는가?


3. P2P 밈의 재건

밈(meme) - 마음에서 전해져 스스로 퍼지고 재생성하는 아이디어. - 88

새로운 P2P 밈 지도 - 100

메타데이터 관리 : 어드레싱과 라우팅 관리, 발견과 검색 서비스, 네임스페이스 마케팅이나 현존하는 것의 효력

"가장자리 서비스"를 통해 인터넷 자원의 활용을 극대화.

IT 병목 현상의 해결책

참여는 가능한 한 능동에 가까워야 하며 피어는 언제든 네트워크에서 빠져나갈 수 있다.


메타데이터는 사용자들이 검색하는 가수 이름과 곡 이름의 조합을 의미한다. 그리고 중앙서버에서 관리하는 이름, 사용자들의 IP 주소, 음악 파일 크기, 사용자의 연결 속도과 같은 부가적인 데이터. - 105

메타데이터는 데이터에 관한 데이터(data about data)인 것이다. - 337

고유 식별자(unique identification)은 메타데이터에서 매우 중요한 기술이다. - 346

하나의 일관성 있는 메타데이터 프레임워크를 사용하고 네트워크에 노출되어 있는 모든 메타데이를 최대한 활용할 수 있는 검색방법을 설계 - 352



키 - 232

모든 문서는 키로 인덱스 된다. 개개의 노드들은 본래부터 신뢰 받지 않기 때문에 노드들이 허위 문서를 반환하지 못하게 해야 한다. 만일 그렇게 하지 않으면 허위 문서들이 캐시에 저장될 것이고 허위 데이터들이 암세포처럼 퍼질 것이다. 키의 주요 임무는 이런 허위 문서들을 예방하는 것이다.

내용 해시 키(CHK, content hash key)는 데이터 해시를 통해 형성된다.


중앙 통제 시스템에서는 중앙 서버를 통해 피어간 협조가 이뤄지며, 모든 협조는 통제를 받는다. 나중에는 중앙 서버에서 받은 정보로 피어끼리 직접 연결한다. - 357

계층 시스템은 통제 권한을 전부 또는 어느 정도 중앙에서 트리의  하위 통제자에게 위임한다. 피어는 그룹 계층에 속하게 되고, 같은 그룹에 있는 피어들 사이에서 이루어지는 통신은 그 그룹을 통제하는 통제자가 중재한다. 그리고 다른 그룹과 통신하려면 상위 통제자를 통과해야 한다.( DNS )

완전히 분산화된 P2P 시스템에는 통제라는 것이 전혀 없다. 모든 통신은 로컬 단계에서 실행되며 전적으로 피어들에 의해 이루어진다. 이런 시스템은 대개 다른 피어를 대신하여 메시지를 전달하는 어떤 전달 장치를 수반한다.


캐싱을 사용하여 특정 데이터가 빈번하게 요청된다면 그 데이터를 요청자 근처에 저장한다. 웹 브라우저도 최근에 방문한 페이지를 캐시에 저장한다.

이 글은 스프링노트에서 작성되었습니다.

Tag |