<질문>
이 문자열이 있습니다 : Hello world !! 파이썬을 사용하여 48 : 65 : 6c : 6c : 6f : 20 : 77 : 6f : 72 : 6c : 64 : 20 : 21 : 21로 인쇄하고 싶습니다.
hex ()는 정수에서만 작동합니다.
어떻게 할 수 있습니까?
<답변1>
문자열을 int 생성기로 변환하고 각 요소에 16 진수 형식을 적용하고 구분 기호로 삽입 할 수 있습니다.
>>> s = "Hello world !!"
>>> ":".join("{:02x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21
<답변2>
':'.join(x.encode('hex') for x in 'Hello World!')
<답변3>
Python 2.x의 경우 :
':'.join(x.encode('hex') for x in 'Hello World!')
위의 코드는 Python 3.x에서 작동하지 않으며 3.x의 경우 아래 코드는 작동합니다.
':'.join(hex(ord(x))[2:] for x in 'Hello World!')
<답변4>
두 줄로 된 또 다른 대답은 일부가 읽기 쉬울 수 있으며 문자열의 줄 바꿈 또는 기타 이상한 문자를 디버깅하는 데 도움이됩니다.
Python 2.7의 경우
for character in string:
print character, character.encode('hex')
Python 3.7의 경우 (3의 모든 릴리스에서 테스트되지 않음)
for character in string:
print(character, character.encode('utf-8').hex())
<답변5>
Fedor Gogolev 답변에 대한 일부 보완 :
첫째, 문자열에 'ASCII 코드'가 10 미만인 문자가 포함되어 있으면 필요에 따라 표시되지 않습니다. 이 경우 올바른 형식은 {: 02x} 여야합니다.
>>> s = "Hello unicode \u0005 !!"
>>> ":".join("{0:x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:75:6e:69:63:6f:64:65:20:5:20:21:21'
^
>>> ":".join("{:02x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:75:6e:69:63:6f:64:65:20:05:20:21:21'
^^
둘째, "문자열"이 실제로 "바이트 문자열"이고 Python 3에서 차이가 중요하기 때문에 다음을 선호 할 수 있습니다.
>>> s = b"Hello bytes \x05 !!"
>>> ":".join("{:02x}".format(c) for c in s)
'48:65:6c:6c:6f:20:62:79:74:65:73:20:05:20:21:21'
바이트 객체는 "0 <= x <256 범위의 불변의 정수 시퀀스"로 정의되므로 위 코드에서 변환 할 필요가 없습니다.
<답변6>
16 진수 바이트로 문자열을 인쇄 하시겠습니까?
허용되는 대답은 다음과 같습니다.
s = "Hello world !!"
":".join("{:02x}".format(ord(c)) for c in s)
보고:
'48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21'
허용되는 대답은 바이트 (대부분 ascii 문자)를 사용하는 한만 작동합니다. 그러나 유니 코드를 사용하는 경우, 예 :
a_string = u"Привет мир!!" # "Prevyet mir", or "Hello World" in Russian.
어떻게 든 바이트로 변환해야합니다.
터미널에서 이러한 문자를 허용하지 않는 경우 UTF-8에서 디코딩하거나 이름을 사용할 수 있습니다 (그러면 나와 함께 코드를 붙여넣고 실행할 수 있음).
a_string = (
"\N{CYRILLIC CAPITAL LETTER PE}"
"\N{CYRILLIC SMALL LETTER ER}"
"\N{CYRILLIC SMALL LETTER I}"
"\N{CYRILLIC SMALL LETTER VE}"
"\N{CYRILLIC SMALL LETTER IE}"
"\N{CYRILLIC SMALL LETTER TE}"
"\N{SPACE}"
"\N{CYRILLIC SMALL LETTER EM}"
"\N{CYRILLIC SMALL LETTER I}"
"\N{CYRILLIC SMALL LETTER ER}"
"\N{EXCLAMATION MARK}"
"\N{EXCLAMATION MARK}"
)
그래서 우리는 다음을 봅니다.
":".join("{:02x}".format(ord(c)) for c in a_string)
보고
'41f:440:438:432:435:442:20:43c:438:440:21:21'
좋지 않은 / 예기치 못한 결과-유니 코드 컨소시엄에서 유니 코드로 보는 문자 소를 만들기 위해 결합 된 코드 포인트입니다.-전 세계의 언어를 나타냅니다. 그러나 이것은 우리가 실제로이 정보를 저장하는 방법이 아니므로 다른 출처에서 해석 할 수 있습니다.
다른 소스에서이 데이터를 사용할 수 있도록하려면 일반적으로 UTF-8 인코딩으로 변환해야합니다. 예를 들어이 문자열을 바이트 단위로 디스크에 저장하거나 html로 게시해야합니다. 따라서 코드 포인트를 UTF-8의 코드 단위로 변환하려면 인코딩이 필요합니다. Python 3에서는 바이트가 정수의 반복 가능하므로 ord가 필요하지 않습니다.
>>> ":".join("{:02x}".format(c) for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
또는 새로운 f- 문자열을 사용하여 더 우아하게 (Python 3에서만 사용 가능) :
>>> ":".join(f'{c:02x}' for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
Python 2에서는 먼저 c를 ord에 전달합니다. 즉, ord (c)-더 많은 예 :
>>> ":".join("{:02x}".format(ord(c)) for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
>>> ":".join(format(ord(c), '02x') for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
<답변7>
hexdump를 사용할 수 있습니다.
import hexdump
hexdump.dump("Hello World", sep=":")
(소문자가 필요한 경우 .lower () 추가). 이것은 Python 2 및 3 모두에서 작동합니다.
<답변8>
map 및 lambda 함수를 사용하면 16 진수 값 목록을 생성 할 수 있으며 인쇄 (또는 다른 용도로 사용) 할 수 있습니다.
>>> s = 'Hello 1 2 3 \x01\x02\x03 :)'
>>> map(lambda c: hex(ord(c)), s)
['0x48', '0x65', '0x6c', '0x6c', '0x6f', '0x20', '0x31', '0x20', '0x32', '0x20', '0x33', '0x20', '0x1', '0x2', '0x3', '0x20', '0x3a', '0x29']
<답변9>
다음과 같은 방법으로 수행 할 수 있습니다.
from __future__ import print_function
str = "Hello World !!"
for char in str:
mm = int(char.encode('hex'), 16)
print(hex(mm), sep=':', end=' ' )
이 출력은 다음과 같이 16 진수로 표시됩니다.
0x48 0x65 0x6c 0x6c 0x6f 0x20 0x57 0x6f 0x72 0x6c 0x64 0x20 0x21 0x21
<답변10>
Python3 또는 콜론에 관심이없는 사람들에게 좀 더 일반적입니다.
from codecs import encode
data = open('/dev/urandom', 'rb').read(20)
print(encode(data, 'hex')) # data
print(encode(b"hello", 'hex')) # string
<답변11>
python2 (내장)에서 base64.b16encode 사용
>>> s = 'Hello world !!'
>>> h = base64.b16encode(s)
>>> ':'.join([h[i:i+2] for i in xrange(0, len(h), 2)]
'48:65:6C:6C:6F:20:77:6F:72:6C:64:20:21:21'
<답변12>
편의상 아주 간단합니다.
def hexlify_byteString(byteString, delim="%"):
''' very simple way to hexlify a bytestring using delimiters '''
retval = ""
for intval in byteString:
retval += ( '0123456789ABCDEF'[int(intval / 16)])
retval += ( '0123456789ABCDEF'[int(intval % 16)])
retval += delim
return( retval[:-1])
hexlify_byteString(b'Hello World!', ":")
# Out[439]: '48:65:6C:6C:6F:20:57:6F:72:6C:64:21'
<답변13>
''.format ()보다 더 많은 성능을 제공하는 경우 다음을 사용할 수 있습니다.
>>> ':'.join( '%02x'%(v if type(v) is int else ord(v)) for v in 'Hello World !!' )
'48:65:6C:6C:6F:20:77:6F:72:6C:64:20:21:21'
>>>
>>> ':'.join( '%02x'%(v if type(v) is int else ord(v)) for v in b'Hello World !!' )
'48:65:6C:6C:6F:20:77:6F:72:6C:64:20:21:21'
>>>
미안하지만 단순히 '% 02x'% v를 수행 할 수 있다면 더 좋을 것 같지 않지만 int 만 걸립니다 ...하지만 ord (를 선택하는 논리없이 바이트 문자열 b ''에 갇히게됩니다. V).
'개발 > Python' 카테고리의 다른 글
pip를 사용하여 pylibmc를 설치할 때 오류 발생 (0) | 2020.09.19 |
---|---|
"return list.sort ()"가 목록이 아닌 None을 반환하는 이유는 무엇입니까? (0) | 2020.09.18 |
iterable의 내용을 세트에 추가하려면 어떻게합니까? (0) | 2020.09.18 |
파이썬에서 "명명 된 튜플"이란 무엇입니까? (0) | 2020.09.18 |