이 포스팅에서는 2019 카카오 블라인드 채용 1차 문제인 ‘오픈채팅방’ 문제를 해설합니다. 본 풀이에 대한 테스트는 https://programmers.co.kr/learn/courses/30/lessons/42893에서 수행하였으며 공식 풀이와 일치하지 않을 수 있습니다.
공식 풀이는 링크를 참조하시기 바랍니다.
출처 : 2019 KAKAO 블라인드 채용 온라인 1차
링크 : https://programmers.co.kr/learn/courses/30/lessons/42893
카테고리 : Graph, DFS, BFS
난이도 : 보통
웹 페이지를 parsing해서 각 페이지의 url과 외부 링크들을 찾아낸다. 페이지의 랭크 점수는 주어진 단어의 출현 빈도인 base 점수에 외부 링크들로부터 얻는 점수를 더한 것이다.
외부 링크로부터 얻는 점수는 (외부 링크 페이지가 갖는 base 점수 / 외부 링크 페이지가 갖는 전체 외부 링크의 갯수)와 같다.
head내에 있는 meta 태그를 찾아 그 내부에 존재하는 https://를 찾아 page의 url을 얻는다.
<a href=”https://로 시작하는 모든 링크를 찾아 page의 외부 링크를 모두 구한다.
페이지의 모든 알파벳이 아닌 문자들을 스페이스로 치환한 이후에 주어진 단어와 소문자로 변환하여 비교한 것이 같은 것을 카운트해서 base 점수를 구한다.
공식에 따라 base 점수의 내림차순 정렬 및 인덱스의 오름차순 정렬로 정답을 구한다.
# 페이지의 URL def get_page_url(page): # 범위가 HEAD 태그 내부 head_start_idx = page.find(“<head>”) meta_start_idx = head_start_idx while True: # 범위가 Meta 태그 내부, head 태그 내부에서 검색 meta_start_idx = page.find(“<meta”, meta_start_idx) meta_end_idx = page.find(“>”, meta_start_idx) if meta_start_idx != –1: # 모든 url은 https://임, meta 태그 시작 위치 이후로 검색 content_idx = page.find(‘https://’, meta_start_idx) content_end_idx = page.find(‘”‘, content_idx) # 유효한 인덱스를 찾았고, meta 태그 내부이면 if content_idx != –1 and content_idx < meta_end_idx: return page[content_idx:content_end_idx] meta_start_idx = meta_end_idx + 1 else: return “” # 외부 링크를 찾는다 def get_external_links(page): starter = ‘<a href=”https://’ idx = 0 links = [] while True: idx = page.find(starter, idx) if idx == –1: return links idx += 9 end_idx = page.find(‘”‘, idx) links.append(page[idx:end_idx]) idx = end_idx + 1 return links # 주어진 단어를 대소문자 관계없이, def get_word_score(word, page): new_page = “” for i in range(len(page)): if (ord(page[i]) >= 65 and ord(page[i]) <= 90) or (ord(page[i]) >= 97 and ord(page[i]) <= 122): new_page += page[i] else: new_page += ” “ words = new_page.split() cnt = 0 for i in range(len(words)): if word.lower() == words[i].lower(): cnt += 1 return cnt def solution(word, pages): page_dic = {} for i in range(len(pages)): page = pages[i] page_url = get_page_url(page) page_dic[page_url] = [–get_word_score(word, page), i] for i in range(len(pages)): page = pages[i] page_url = get_page_url(page) external_links = get_external_links(page) word_score = get_word_score(word, page) for link in external_links: if link in page_dic and link != page_url: page_dic[link][0] –= (word_score / len(external_links)) result = list(page_dic.values()) result.sort() return result[0][1] | cs |
Competition 카카오 블라인드 채용 매칭 점수
합격왕 우여곡절 끝에 드디어 합격왕에 광고를 붙였다. 서비스를 시작한지 무려 4년이 지나서야 드디어 광고를 시작하게…
반복적인 일상 매일 아침 일어나 회사에 출근하고, 저녁을 먹고 돌아오는 일상의 반복이다. 주말은 가족을 보러…
Planning A well-structured plan has the following characteristics: First, the ultimate vision you aim to…
English The most common problem for English learners like myself is that we often use…
This website uses cookies.