Network Analysis 안용열
A Few Good Man Robert Wagner Austin Powers: The spy who shagged me Wild Things Let’s make it legal Barry Norton What Price Glory Monsieur Verdoux
Basic Concepts Nodes Links Degree = 3 A shortest path with path length=3 (Equivalent with 3 clicks in WWW)
Basic Concepts : Degree Distribution Degree Occurrence k o Number of k-degree- Nodes is o
Basic Concepts : Power Law Exponential Network Scale-free Network
Small World Milgram’s mail experiment Small world project : WWW’s diameter ~ 20 clicks
Strength of weak ties Granovetter shows the strength of weak ties Weak ties = Shortcut between heterogeneous communities
High Clustering 내 친구 A 가 내 친구 B 를 알고 있을 확률 A 라는 임의의 사람이 B 라는 임의의 사람을 알고 있을 확률 Network has many triangles!!
Small-world network model Networks are small world, and highly clustered. Duncan Watts & Steven Strogatz made a model
Small world network model Shows Small-World behavior (Of course..) Shows High clustering But, does not shows Power-law degree distribution
Scale-Free Network Barabasi & Albert & Jeong shows that Internet has Power-law degree distribution Power-Law degree distribution = Scale-free Power-Law degree distribution means, “very large hubs exist”
Network Centralities Degree Closeness Betweenness(=load) Range
Degree 얼마나 많은 링크를 가지고 있는가 ? High degree centrality ‘Hub’ 보통 가장 중요한 centrality
Closeness 얼마나 다른 이들과 가까운가 ? 1/ ( 모든 노드들의 쌍들의 거리 합 )
Betweenness 얼마나 주요 길목에 위치하는가 ? 모든 노드쌍들에 대해서 그 둘을 잇는 가 장 짧은 길을 찾고, 그 길 위에 있는 노드 들의 Betweenness 값을 올려준다.
Betweenness Centrality (BC) [Freeman, 1977] Example: the BC at k contributed by the communication from i to j is Accumulate over all ordered pairs: i j k 11 b i j (k) ( fraction in the number of the shortest paths between i and j that pass through k. ) “How much is the k-th node influential to the communication between i and j”
Load Example: load at k due to a packet from i to j is Accumulate over all ordered pairs: i j k 11 l i j (k) (fraction of a unit packet sent from node i to node j along the shortest paths, that pass through k, assuming even division at branching points and accumulation at merging points.)
Range 어떤 링크가 있을 때, 그 링크가 얼마나 ‘ 숏 ’ 컷인가 ? 링크를 자른 뒤 그 링크가 연결하고 있던 두 노드사이의 거리를 잰다.
In Computer Program.. : Network Two column format … Means
In Computer Program.. : Network Neighbor Array Degree is the number of neighbors
In Computer Program.. : Closeness, Betweenness 이런 centrality 들을 계산하기 위해서는 모 든 node pair 에 대한 계산이 필요 네트 워크의 노드개수가 n 개라면, node pair 의 수는 n(n-1)/2 ~ n^2 네트워크가 커질수록 계산이 대단히 힘 들어짐. Breadth-first algorithm 을 이용
In Computer Program.. : Closeness, Betweenness 한 노드로부터 출발하여 다른 모든 노드 로 가는 shortest path 를 한 번에 구한 뒤에 각 path 를 거꾸로 밟아오면서 Betweenness 를 구한다. 자세한 알고리즘 :
Centrality 의 이용 Epidemics Community identification …..
Epidemic spreading, idea spreading Hub 때문에 Scale-free network 위에서는 전염병이 사라지지 않음 Hub 만 감염시키면 삽시간에 전 네트워크 로 어떤 idea 나 정보들을 퍼뜨릴 수 있다.
Immunization strategy 임의의 한 명을 골라서 그 사람을 접종시 키지 말고 그 사람의 친구에게 예방접종 을 시키는 방법 사실상 링크를 임의로 선택하는 것이기 때문에 링크를 많이 가지고 있는 허브에 게 예방접종이 될 확률이 높아진다.
Community Identification Every social networks have community structure. network
Community Identification 대표적인 알고리즘 : Girvan-Newman algorithm –Based on betweenness centrality
Community Identification Edge clustering coefficient 를 이용한 알고 리즘 Voltage 를 이용한 알고리즘 Flow 를 이용한 알고리즘 …
Tools Pajek Netminer
참고사이트 : 실험실 홈페이지 : 노틀담 대 학 network 홈페이지 lj.si/pub/networks/pajek/ : pajek 홈페이지 lj.si/pub/networks/pajek/ : netminer 홈페 이지