카카오 블라인드 채용

[카카오] 2019 KAKAO BLIND RECRUITMENT 1차 풀이 – 매칭 점수

이 포스팅에서는 2019 카카오 블라인드 채용 1차 문제인 ‘오픈채팅방’ 문제를 해설합니다. 본 풀이에 대한 테스트는 https://programmers.co.kr/learn/courses/30/lessons/42893에서 수행하였으며 공식 풀이와 일치하지 않을 수 있습니다.

공식 풀이는 링크를 참조하시기 바랍니다.


길찾기 게임

출처 : 2019 KAKAO 블라인드 채용 온라인 1차
링크 : https://programmers.co.kr/learn/courses/30/lessons/42893
카테고리 : Graph, DFS, BFS
난이도 : 보통


문제 설명

웹 페이지를 parsing해서 각 페이지의 url과 외부 링크들을 찾아낸다. 페이지의 랭크 점수는 주어진 단어의 출현 빈도인 base 점수에 외부 링크들로부터 얻는 점수를 더한 것이다.

외부 링크로부터 얻는 점수는 (외부 링크 페이지가 갖는 base 점수 / 외부 링크 페이지가 갖는 전체 외부 링크의 갯수)와 같다.


문제 풀이

head내에 있는 meta 태그를 찾아 그 내부에 존재하는 https://를 찾아 page의 url을 얻는다.

<a href=”https://로 시작하는 모든 링크를 찾아 page의 외부 링크를 모두 구한다.

페이지의 모든 알파벳이 아닌 문자들을 스페이스로 치환한 이후에 주어진 단어와 소문자로 변환하여 비교한 것이 같은 것을 카운트해서 base 점수를 구한다.

공식에 따라 base 점수의 내림차순 정렬 및 인덱스의 오름차순 정렬로 정답을 구한다.


정답 코드

# 페이지의 URL
def get_page_url(page):
# 범위가 HEAD 태그 내부
head_start_idx = page.find(“<head>”)
meta_start_idx = head_start_idx
while True:
# 범위가 Meta 태그 내부, head 태그 내부에서 검색
meta_start_idx = page.find(“<meta”, meta_start_idx)
meta_end_idx = page.find(“>”, meta_start_idx)
if meta_start_idx != 1:
# 모든 url은 https://임, meta 태그 시작 위치 이후로 검색
content_idx = page.find(‘https://’, meta_start_idx)
content_end_idx = page.find(‘”‘, content_idx)
# 유효한 인덱스를 찾았고, meta 태그 내부이면
if content_idx != 1 and content_idx < meta_end_idx:
return page[content_idx:content_end_idx]
meta_start_idx = meta_end_idx + 1
else:
return “”
# 외부 링크를 찾는다
def get_external_links(page):
starter = ‘<a href=”https://’
idx = 0
links = []
while True:
idx = page.find(starter, idx)
if idx == 1:
return links
idx += 9
end_idx = page.find(‘”‘, idx)
links.append(page[idx:end_idx])
idx = end_idx + 1
return links
# 주어진 단어를 대소문자 관계없이,
def get_word_score(word, page):
new_page = “”
for i in range(len(page)):
if (ord(page[i]) >= 65 and ord(page[i]) <= 90) or (ord(page[i]) >= 97 and ord(page[i]) <= 122):
new_page += page[i]
else:
new_page += ” “
words = new_page.split()
cnt = 0
for i in range(len(words)):
if word.lower() == words[i].lower():
cnt += 1
return cnt
def solution(word, pages):
page_dic = {}
for i in range(len(pages)):
page = pages[i]
page_url = get_page_url(page)
page_dic[page_url] = [get_word_score(word, page), i]
for i in range(len(pages)):
page = pages[i]
page_url = get_page_url(page)
external_links = get_external_links(page)
word_score = get_word_score(word, page)
for link in external_links:
if link in page_dic and link != page_url:
page_dic[link][0] = (word_score / len(external_links))
result = list(page_dic.values())
result.sort()
return result[0][1]
cs

Competition 카카오 블라인드 채용 매칭 점수

admin

Recent Posts

2024년 11월 3일 일요일 – 서울 생활 127주차

반복적인 일상 매일 아침 일어나 회사에 출근하고, 저녁을 먹고 돌아오는 일상의 반복이다. 주말은 가족을 보러…

2일 ago

2024년 10월 6일 일요일 – 서울 생활 123주차

Planning A well-structured plan has the following characteristics:   First, the ultimate vision you aim to…

1개월 ago

2024년 9월 29일 일요일 – 서울 생활 122주차

English The most common problem for English learners like myself is that we often use…

1개월 ago

2024년 9월 22일 일요일 – 서울 생활 121주차

추석 추석을 맞아 친가 외가 처가 어르신들을 모두 뵙고 돌아왔다. 아이가 태어난지는 좀 됐지만 한국에서…

1개월 ago

2024년 9월 8일 일요일 – 서울 생활 119주차

주말 이번주는 아내가 올라와서 주말을 함께 보냈다. 둘만 밥도 먹고 뮤지컬도 보고, 모임도 나가고 집에서…

2개월 ago

2024년 9월 1일 일요일 – 서울 생활 118주차

여행 지난주에 코로나에 걸리는 바람에 근 3주만에 가족을 만나고 왔다. 집에 있어봐야 시간도 안가고 할…

2개월 ago

This website uses cookies.