Chapter5

Chapter Five - Advanced Publish-Subscribe

제 3,4장에서 우리는 ØMQ의 request-reply 패턴을 사용해 봤습니다. 모든 것을 이해 했다면 축하합니다. 본 장에서는 publish-subscrib에 대해서 다룰 것이며, 성능, 신뢰성, 상태 배포, 보안을 위한 높은수준의 유형들(higher-level patterns)을 포함해서 ØMQ의 핵심인 pub-sub 유형을 살펴 볼 것입니다.

본장에서 다룰 내용:

too-slow subscribers 를 처리하는 방법 (the Suicidal Snail pattern).

*high-speed subscribers를 설계하는 방법 (the Black Box pattern).
*shared key-value cache를 구축하는 방법 (the Clone pattern).

Slow Subscriber Detection (Suicidal Snail Pattern)

top prev next

실생활에서 pub-sub 패턴을 사용할 때 이슈가 될만한 문제는 slow subscriber 입니다. 일반적으로, publishers는 subscribers에게 최고속도로 데이터를 보냅니다. 현실적으로 subscriber applications은 Interprited언어로 작성 되거나, 많은 작업을 수행하며, 또는 Publisher의 부하를 유지하지 못할 정도가 될 수 있습니다.

어떻게 slow subscriber를 처리할 수 있을까요? 더 빠른 subscriber를 만들기 위해서는 시간과 노력이 많이 필요합니다. slow subscriber를 해결하기 위한 전형적인 전략 몇 가지 있습니다. :

Queue messages on the publisher. 몇 시간 동안 메일을 읽지 않았을 때 하는 GMAIL이 하는 행동 입니다. 그러나 high-volume messaging(대용량 메세징)에서, queue에 publishing할 수 있지만, publisher는 메모리 부족과 오작동의 결과가 초래될 수 있습니다. 특히, subscriber가 많다면 성능차원에서 디스크 flush가 원활하지 않을 수 있습니다.

Queue messages on the subscriber. 이 방식은 좀 더 좋은 방법이며, ØMQ가 기본적으로 제공하는 기능입니다. 큐를 사용해서 메모리 부족과 오작동이 발생하면 publisher보다는 subscriber쪽이 낫습니다. 이것은 subscriber가 수용할 수 없는 최고부하 시점에는 큐잉을 하고 여유로운 시점에는 나머지를 처리할 수 있는 완벽한 방법입니다. 그러나 subscriber가 너무 느리다면 문제가 발생됩니다.

Stop queuing new messages after a while. 이것은 메일 함 용량이 7.555GB가 넘을 때 Gmail이 하는 것입니다. 신규 메시지가 바로 거부되거나 삭제 됩니다. 이것은 publisher의 관점에서 훌륭한 전략이며, publisher가 최고 수위 점 or HWM 을 설정하였을 때 ØMQ가 하는 것이다. 그러나 그것은 여전히 우리가 slow subscriber를 해결하는데 도움이 되지 않습니다. 지금, 우리는 message stream에서 해결할 것입니다.

Punish slow subscribers with disconnect. 15번째 Hotmail 계정에 2주 동안 Login 하지 않을 때 Hotmail이 하는 것입니다 이것은 subscriber에서 주의를 요하게 하며, 이상적 일수도 있지만, ØMQ는 이렇게 처리하지 않습니다.

이것은 나의 15번째 Hotmail 계정에, 내가 2주 동안 Login 하지 않을 때 Hotmail이 하는 것입니다. 이것은 subscriber에서 주의를 요하게 하며, 이상적 일수도 있지만, ØMQ는 이렇게 처리하지 않습니다.
이러한 전형적인 전략에 적합한 것은 아무것도 없습니다. 그래서 창의성이 필요합니다. Publisher가 연결을 끊는 것 보다는 subscriber 자체가 죽도록 하는 하는 것이 좋을 것 같습니다. 이것이 the Suicidal Snail pattern 입니다. Subscriber는 너무 느리게 동작한다고 판단될 때 죽는 것입니다.
Subscriber는 어떻게 이것을 감지할 수 있습니까? 한가지 방법은 메시지에 순서대로 번호를 (순서대로 숫자를 매기는 것) 부여하고, publisher에 HVM 를 적용하는 것 입니다. Subscriber가 GAP(예: 번호가 연속되지 않습니다.)를 발견한다면, 그것은 무언가 잘못된 것을 알게 되는 것입니다. 우리는 적당하게 죽는 수준을 정하기 위해 HVM을 조정합니다.

이 솔루션에는 2가지 문제가 있습니다. 첫째, 많은 publisher가 있을 때, 우리는 어떻게 messages에 시퀀스를 매깁니까? 이 솔루션은 각 publisher에게 유일한 ID를 주고, 시퀀스를 추가해야 합니다. 둘째, subscribers가 ZMQ_SUBSCRIBE 필터를 사용하면, 정의된 것에 의해서 GAP이 생깁니다. 그러면 시퀀스를 부여하는 것은 무의미 해집니다.

일부 use-case에서 필터를 사용하지 않으면 시퀀스는 잘 처리 될 것입니다. 그러나 보다 일반적인 솔루션은 publisher가 각각의 메시지에 timestamps 사용하는 것입니다. Subscriber가 메시지를 받았을 때 시간을 확인하고, 그 차이가 1초 이상이라면, 그것은 죽는 것입니다.
The Suicide Snail pattern은 subscribers들의 자신의 clients 와 service-level agreements을 가지고, 특정 최대 latencies를 보장할 때 동작합니다. Subscriber를 중지하기 위해 최대 latency보장하는 좋은 방법처럼 보이지 않을 수도 있지만 그것은 assertion model입니다. 오늘이 지나면, 그 문제는 해결될 것입니다. 늦게 데이터를 처리하도록 허락하면, 그 문제가 더 광범위하게 영향을 주는 원인이 되고, 원인 분석하는데 시간이 오래 걸리 수 있습니다.

이것은 Suicidal Snail에 대한 예제 입니다. :

suisnail: Suicidal Snail in C

//
// Suicidal Snail
//
#include "czmq.h"

// ---------------------------------------------------------------------
// This is our subscriber
// It connects to the publisher and subscribes to everything. It
// sleeps for a short time between messages to simulate doing too
// much work. If a message is more than 1 second late, it croaks.

#define MAX_ALLOWED_DELAY 1000 // msecs

static void
subscriber (void *args, zctx_t *ctx, void *pipe)
{
// Subscribe to everything
void *subscriber = zsocket_new (ctx, ZMQ_SUB);
zsocket_connect (subscriber, "tcp://localhost:5556");

// Get and process messages
while (1) {
char *string = zstr_recv (subscriber);
printf("%s\n", string);
int64_t clock;
int terms = sscanf (string, "%" PRId64, &clock);
assert (terms == 1);
free (string);

// Suicide snail logic
if (zclock_time () - clock > MAX_ALLOWED_DELAY) {
fprintf (stderr, "E: subscriber cannot keep up, aborting\n");
break;
}
// Work for 1 msec plus some random additional time
zclock_sleep (1 + randof (2));
}
zstr_send (pipe, "gone and died");
}

// ---------------------------------------------------------------------
// This is our server task
// It publishes a time-stamped message to its pub socket every 1ms.

static void
publisher (void *args, zctx_t *ctx, void *pipe)
{
// Prepare publisher
void *publisher = zsocket_new (ctx, ZMQ_PUB);
zsocket_bind (publisher, "tcp://*:5556");

while (1) {
// Send current clock (msecs) to subscribers
char string [20];
sprintf (string, "%" PRId64, zclock_time ());
zstr_send (publisher, string);
char *signal = zstr_recv_nowait (pipe);
if (signal) {
free (signal);
break;
}
zclock_sleep (1); // 1msec wait
}
}

// This main thread simply starts a client, and a server, and then
// waits for the client to signal it's died.
//
int main (void)
{
zctx_t *ctx = zctx_new ();
void *pubpipe = zthread_fork (ctx, publisher, NULL);
void *subpipe = zthread_fork (ctx, subscriber, NULL);
free (zstr_recv (subpipe));
zstr_send (pubpipe, "break");
zclock_sleep (100);
zctx_destroy (&ctx);
return 0;
}

C++ | Lua | PHP | Python | Ada | Basic | C# | Clojure | CL | Erlang | F# | Go | Haskell | Haxe | Java | Node.js | Objective-C | ooc | Perl | Ruby | Scala

이 예제에 대한 참고 사항:

이 메시지는 여기에 milliseconds 번호로 현재 시스템 시간으로 단순하게 구성되어 있습니다. 현실적인 application에서는 적어도 timestamp를 포함한 메시지 header와 데이터 메시지 body를 가져아 합니다.

예를 들어 한 프로세스에 두개의 스레드로 subscriber 와 publisher가 있습니다. 실제로 그들은 별개의 프로세스 입니다. 스레드를 사용하면 데모가 좀더 편리 합니다.

High-speed Subscribers (Black Box Pattern)

top prev next

pub-sub에 대한 일반적인 use-case는 다량의 데이터 스트림을 배포하는 것입니다. 예를 들어 증권거래소의 ‘시장 데이터’ 입니다. 전형적으로 publisher는 주식을 거래하기 위해 연결하고, 값을 책정한 다음 subscriber에게 그것을 보냅니다. Subscriber가 소수라면, 우리는 TCP를 사용할 수 있으며, Subscriber가 다수라면, 우리는 아마 신뢰할 수 있는 멀티 캐스트, 즉 PGM을 사용할 것입니다..
100bytes메시지를 초당 평균 100,000을 처리한다고 생각해 봅시다. 이것은 전형적인 속도입니다. 초당 100K 메시지는 ØMQ application에서 쉽게 처리할 수 있으며, 우리는 훨씬 더 빠른 처리를 원합니다.
그래서 우리는 publisher 하나, 각 subscriber당 하나씩 서버로 구성합니다. 8개 core, 12개 publisher로 잘 정의된 서버들이 있습니다. (2015년에 이것을 읽는다면, 그때 가이드는 완료될 예정입니다. 이 숫자에 0을 추가 하십시오.)

그리고 이것은 subscriber에게 데이터를 넣을 때, 두 가지 주의사항 입니다. :

우리가 메시지 처리를 아주 조금 처리 했어도, 다시 publisher의 처리를 따라 잡을 수 없는 지점에서 subscriber 속도가 느려집니다.
우리는 주의 깊게 최적화와 TCP를 튜닝 한 후, 약 초당 6M 메시지를 처리하도록 Publisher와 subscriber 모두에게 부하를 줄 것입니다.

우리가 해야 하는 첫 번째 일은 멀티스레드로 설계에 subscriber를 끼워 넣는 것입니다. 그래서 다른 스레드에서 메시지를 읽는 동안 스레드 중 한 세트에서 메시지를 처리 할 수 있습니다. 일반적으로 우리는 똑같은 방법으로 모든 메시지를 처리하기를 원하지 않습니다. 오히려 subscriber는 아마 prefix key로 대부분의 메시지를 필터링 합니다. 메시지가 어떤 기준과 일치하면, subscriber는 메시지를 처리하는 작업자를 호출합니다. ØMQ에서 이것은 작업자 스레드에게 메시지를 보내는 것을 의미합니다.

그래서 subscriber는 queue device 같은 것으로 보입니다. 우리는 subscriber와 작업자들을 연결하는 다양한 소켓을 사용할 수 있습니다. 만약 단 방향 트래픽 이고 모두 동일한 작업을 처리한다면 우리는 PUSH와 PULL 사용할 수 있으며, ØMQ에 모든 라우팅 작업을 위임할 수 있습니다. 이것은 가장 간단하고 빠른 접근방법입니다. :

Subscriber는 TCP 또는 PGM을 통해 Publisher와 통신합니다. Subscriber는 inproc를 통해 모두 동일한 프로세스로 Workers와 이야기 합니다.
이제 한계를 벗어날 때 입니다. subscribe 스레드가 CPU 100 %에 도달한 일이 발생한 것은 하나의 스레드이기 때문이며, 그것은 하나 이상의 코어를 사용할 수 없습니다. 단일 스레드는 항상 초당 2M, 6M, 또는 그 이상 메시지로 한계에 도달할 것입니다. 우리는 다수의 스레드에 걸쳐 작업을 분할하기를 원하며, 병렬로 실행할 수 있습니다.

많은 고성능 제품에서 사용하는 접근방법은 분할입니다. 병렬 및 독립적인 스트림으로 작업은 분할한다는 것을 의미 합니다. 예로 topic key의 절반은 한 스트림에서, 절반은 다른 스트림으로 실행 합니다. 우리는 많은 스트림을 사용할 수 있지만, 여유 cpu가 없다면 성능이 향상되지 않습니다.

그래서 두 스트림으로 조작하는 방법을 보겠습니다. :

두 스트림에서 최대 속도로 처리하기 위해, 우리는 다음과 같이 ØMQ를 구성하는 것입니다. :

하나보다는 두 개의 I / O 스레드.
두 개의 네트워크 인터페이스 (NIC), 각 subscriber마다 하나씩.
각 I / O 스레드는 특정 NIC에 바인딩
특정 코어에 바인딩된 두 subscriber스레드.
두 개의 SUB 소켓, 각 subscriber스레드 마다 하나씩.
나머지 코어들은 작업자 스레드들에게 할당.
작업자 스레드는 양쪽 subscriber PUSH 소켓에 연결

우리의 아키텍쳐는 이상으로 스레드당 한 코어를 가집니다. 일단 우리가 코아보다 더 많은 스레드를 생성하면, 스레간의 경합이 발생하고, 반환이 점점 떨어질 겁니다. 예를들어 더 많은 I/O 스레드를 생성하는 것은 어떤 이득도 없을 것입니다.

A Shared Key-Value Cache (Clone Pattern)

top prev next

pub-sub는 라디오 방송과 유사합니다. 당신이 가입하기 전엔 아무것도 없으며, 당신이 얻고자 하는 수많은 정보는 당신이 수용하려는 양에 의존합니다. 놀랍게도 “완벽”을 목포로 하는 엔지니어들에겐 이 모델이 정보의 실제 배포와 완벽하게 매치되기 때문에 유용하고 넓게 확산되어 있습니다. 페이스 북과 트위터, BBC 월드 서비스 및 스포츠 결과를 생각해 보세요.

그러나 가능하다면, 보다 신뢰가능한 pub-sub이 가치가 있는 많은 경우가 있습니다. 우리가 request-reply 위해 했던 것처럼 오류 동작하는 시각에서 신뢰성을 정의 해야 합니다. pub-subd의 고전적인 문제는 다음과 같습니다. :

Subscriber들의 늦은 가입, 그래서 서버에 이미 전달되어 메시지를 놓친 경우
Subscriber의 연결 속도가 느려, 그 시간 동안 메시지를 잃는 경우.
Subscriber들이 떠나가서, 떠나있는 동안 메시지를 잃는 경우.

드물지만, 이와 같은 문제도 있습니다. :

Subscriber들은 충돌, 재시작 할 수 있고, 이미 받은 데이터를 잃을 수 있습니다.
Subscriber들은 메시지들을 너무 느리게 처리합니다. 그래서 queue에 쌓고, 다음 overflow 될 수 있습니다.
Networks에서 과부하가 발생하고, 데이터를 놓칠 수 있습니다. (specifically, for PGM).
Networks에서 속도가 너무 느려져서, publisher-side queues overflow되고, publishers crash.

더 많이 잘못될 수 있지만 이것은 현재의 시스템에서 볼 수 있는 전형적인 오류입니다.

우리는 “the Suicidal Snail pattern”으로 느린 subscriber처럼 이것들의 몇 가지를 해결 하였습니다. 그러나 나머지는 신뢰성 있는 pub-sub을 위하여 포괄적이고, 재사용할 수 있는 프레워크를 가져가는 것이 좋을 것입니다.

어려운점은 우리의 대상 Application이 실제로 그들의 데이터를 가지고 하고자 하는 것이 무엇인가 라는 아이디어가 없다는 것입니다. 그들은 그것을 필터링하고, 메시지의 하위집합만 처리 합니까? 그들은 나중에 재사용을 위하여 데이터를 어딘가에 기록합니까? 그들은 작업자에게 그 이상으로 데이터를 배포합니까? 그럴듯한 시나리오는 수십가지 있으며, 각각 어떤 신뢰성수단, 노력과 성능측면에서 그것의 가치가 얼마인지에 따라 자신의 아이디어를 가질 수 있습니다.

그래서 우리는 구현할 수 있는 abstraction을 구축할 것입니다. 그리고 많은 applications에서 재사용 합니다. 이 abstraction은 고유 키에 의해 색인된 blobs의 집합으로 저장하는 shared value-key cached 입니다.

분산 네트워크에서 피어(peers) 연결의 광범위한 문제를 해결하는 분산 hash tables나 non ?SQL 데이터베이스와 같은 역할을 하는 분산key-value tables와 혼동하지 마십시오. 구축할 모든 것은 서버에서 클라이언트 세트에 안정적인 일부 메모리상태를 복제하는 시스템입니다. 우리가 원하는 아래와 같습니다. :

클라이언트를 언제든지 네트워크에 연계시키고, 안정적으로 현재 서버 상태를 유지합니다.
모든 클라이언트에 key-value cache를 업데이트 (새로운 key-value pairs를 삽입, or 기존의 key-value로 업데이트, or key-value 등을 삭제)
안정적으로 모든 클라이언트에 변경사항을 전파하고, 이것은 최소한의 잠재 오버헤드 가집니다.
수천, 수만의 클라이언트를 처리합니다.

클론 패터의 핵심은 클라이언트가 서버로 응답을 보낼 수 있다는 것입니다. 이것은 일반적인 pub-sub보다 훨씬 더 발전한 것입니다. 이런 이유로 이 글에서는 publisher, subscriber라는 용어대신 server, client라는 용어를 사용하고 있습니다. 클론은 내부적으로 pub-sub을 사용하기는 하지만 그 이상의 기능을 제공합니다.

Distributing Key-Value Updates

top prev next

이번 단계에서는 한번에 한가지 문제를 해결하도록 하는 Clone을 개발합니다. 첫번째로, 서버에있는 클라이언트들에게 key-value 업데이트를 배포하는 방법을 살펴 보겠습니다. 우리는1장에서 weather server를 다루었으며, 한 쌍의 key-value로 메시지를 보내기 위해 이것을 refactor했습니다. 우리는 해시 테이블에 이들을 저장하기 위해 우리의 클라이언트를 수정합니다. :

이것은 서버입니다. :

clonesrv1: Clone server, Model One in C

Python | Ada | Basic | C++ | C# | Clojure | CL | Erlang | F# | Go | Haskell | Haxe | Java | Lua | Node.js | Objective-C | ooc | Perl | PHP | Ruby | Scala

그리고 이것은 클라이언트입니다. :

clonecli1: Clone client, Model One in C

Python | Ada | Basic | C++ | C# | Clojure | CL | Erlang | F# | Go | Haskell | Haxe | Java | Lua | Node.js | Objective-C | ooc | Perl | PHP | Ruby | Scala

이 코드에 대한 몇 가지 참고사항 입니다. :

모든 어려운 작업은 kvmsg 클래스에서 이루어집니다. 이 클래스는 key-value 메시지 객체와 함께 작동하며,이 클래스는 3개의 프레임으로 구성된 다중 ØMQ 메시지 입니다. : a key (a ØMQ string), a sequence number (64-bit value, in network byte order), and a binary body (holds everything else).

서버는 randomized 4-digit key로 메시지를 생성합니다. 크지만 엄청나지 않은 hash table(10K entries)을 시물레이션 할 수 있습니다.

서버는 소켓을 바인딩 이후 200 millisecond 동안 정지합니다. 이것은 substriber가 서버의 소켓에 연결할 때 메시지를 잃는 "slow joiner syndrome"을 방지합니다. 우리는 이 "slow joiner syndrome"를 이후 버전에서 해결할 것입니다

우리는 소켓을 참조하는 코드에서 'publisher' 와 'subscriber' 을 사용합니다. 이것은 우리가 다중 소켓들을 가지고 여러가지 일들을 할 때 나중에 도움이 될 것입니다.

현재 동작하는 것 중 가장 간단한 형태의 kvmsg 클래스가 있습니다. :

kvsimple: Key-value message class in C

/* =====================================================================
kvsimple - simple key-value message class for example applications

---------------------------------------------------------------------
Copyright (c) 1991-2011 iMatix Corporation <www.imatix.com>
Copyright other contributors as noted in the AUTHORS file.

This file is part of the ZeroMQ Guide: http://zguide.zeromq.org

This is free software; you can redistribute it and/or modify it under
the terms of the GNU Lesser General Public License as published by
the Free Software Foundation; either version 3 of the License, or (at
your option) any later version.

This software is distributed in the hope that it will be useful, but
WITHOUT ANY WARRANTY; without even the implied warranty of
MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
Lesser General Public License for more details.

You should have received a copy of the GNU Lesser General Public
License along with this program. If not, see
<http://www.gnu.org/licenses/>.
=====================================================================
*/

#include "kvsimple.h"
#include "zlist.h"

// Keys are short strings
#define KVMSG_KEY_MAX 255

// Message is formatted on wire as 4 frames:
// frame 0: key (0MQ string)
// frame 1: sequence (8 bytes, network order)
// frame 2: body (blob)
#define FRAME_KEY 0
#define FRAME_SEQ 1
#define FRAME_BODY 2
#define KVMSG_FRAMES 3

// Structure of our class
struct _kvmsg {
// Presence indicators for each frame
int present [KVMSG_FRAMES];
// Corresponding 0MQ message frames, if any
zmq_msg_t frame [KVMSG_FRAMES];
// Key, copied into safe C string
char key [KVMSG_KEY_MAX + 1];
};

// ---------------------------------------------------------------------
// Constructor, sets sequence as provided

kvmsg_t *
kvmsg_new (int64_t sequence)
{
kvmsg_t
*self;

self = (kvmsg_t *) zmalloc (sizeof (kvmsg_t));
kvmsg_set_sequence (self, sequence);
return self;
}

// ---------------------------------------------------------------------
// Destructor

// Free shim, compatible with zhash_free_fn
void
kvmsg_free (void *ptr)
{
if (ptr) {
kvmsg_t *self = (kvmsg_t *) ptr;
// Destroy message frames if any
int frame_nbr;
for (frame_nbr = 0; frame_nbr < KVMSG_FRAMES; frame_nbr++)
if (self->present [frame_nbr])
zmq_msg_close (&self->frame [frame_nbr]);

// Free object itself
free (self);
}
}

void
kvmsg_destroy (kvmsg_t **self_p)
{
assert (self_p);
if (*self_p) {
kvmsg_free (*self_p);
*self_p = NULL;
}
}

// ---------------------------------------------------------------------
// Reads key-value message from socket, returns new kvmsg instance.

kvmsg_t *
kvmsg_recv (void *socket)
{
assert (socket);
kvmsg_t *self = kvmsg_new (0);

// Read all frames off the wire, reject if bogus
int frame_nbr;
for (frame_nbr = 0; frame_nbr < KVMSG_FRAMES; frame_nbr++) {
if (self->present [frame_nbr])
zmq_msg_close (&self->frame [frame_nbr]);
zmq_msg_init (&self->frame [frame_nbr]);
self->present [frame_nbr] = 1;
if (zmq_recvmsg (socket, &self->frame [frame_nbr], 0) == -1) {
kvmsg_destroy (&self);
break;
}
// Verify multipart framing
int rcvmore = (frame_nbr < KVMSG_FRAMES - 1)? 1: 0;
if (zsockopt_rcvmore (socket) != rcvmore) {
kvmsg_destroy (&self);
break;
}
}
return self;
}

// ---------------------------------------------------------------------
// Send key-value message to socket; any empty frames are sent as such.

void
kvmsg_send (kvmsg_t *self, void *socket)
{
assert (self);
assert (socket);

int frame_nbr;
for (frame_nbr = 0; frame_nbr < KVMSG_FRAMES; frame_nbr++) {
zmq_msg_t copy;
zmq_msg_init (&copy);
if (self->present [frame_nbr])
zmq_msg_copy (&copy, &self->frame [frame_nbr]);
zmq_sendmsg (socket, &copy,
(frame_nbr < KVMSG_FRAMES - 1)? ZMQ_SNDMORE: 0);
zmq_msg_close (&copy);
}
}

// ---------------------------------------------------------------------
// Return key from last read message, if any, else NULL

char *
kvmsg_key (kvmsg_t *self)
{
assert (self);
if (self->present [FRAME_KEY]) {
if (!*self->key) {
size_t size = zmq_msg_size (&self->frame [FRAME_KEY]);
if (size > KVMSG_KEY_MAX)
size = KVMSG_KEY_MAX;
memcpy (self->key,
zmq_msg_data (&self->frame [FRAME_KEY]), size);
self->key [size] = 0;
}
return self->key;
}
else
return NULL;
}

// ---------------------------------------------------------------------
// Return sequence nbr from last read message, if any

int64_t
kvmsg_sequence (kvmsg_t *self)
{
assert (self);
if (self->present [FRAME_SEQ]) {
assert (zmq_msg_size (&self->frame [FRAME_SEQ]) == 8);
byte *source = zmq_msg_data (&self->frame [FRAME_SEQ]);
int64_t sequence = ((int64_t) (source [0]) << 56)
+ ((int64_t) (source [1]) << 48)
+ ((int64_t) (source [2]) << 40)
+ ((int64_t) (source [3]) << 32)
+ ((int64_t) (source [4]) << 24)
+ ((int64_t) (source [5]) << 16)
+ ((int64_t) (source [6]) << 8)
+ (int64_t) (source [7]);
return sequence;
}
else
return 0;
}

// ---------------------------------------------------------------------
// Return body from last read message, if any, else NULL

byte *
kvmsg_body (kvmsg_t *self)
{
assert (self);
if (self->present [FRAME_BODY])
return (byte *) zmq_msg_data (&self->frame [FRAME_BODY]);
else
return NULL;
}

// ---------------------------------------------------------------------
// Return body size from last read message, if any, else zero

size_t
kvmsg_size (kvmsg_t *self)
{
assert (self);
if (self->present [FRAME_BODY])
return zmq_msg_size (&self->frame [FRAME_BODY]);
else
return 0;
}

// ---------------------------------------------------------------------
// Set message key as provided

void
kvmsg_set_key (kvmsg_t *self, char *key)
{
assert (self);
zmq_msg_t *msg = &self->frame [FRAME_KEY];
if (self->present [FRAME_KEY])
zmq_msg_close (msg);
zmq_msg_init_size (msg, strlen (key));
memcpy (zmq_msg_data (msg), key, strlen (key));
self->present [FRAME_KEY] = 1;
}

// ---------------------------------------------------------------------
// Set message sequence number

void
kvmsg_set_sequence (kvmsg_t *self, int64_t sequence)
{
assert (self);
zmq_msg_t *msg = &self->frame [FRAME_SEQ];
if (self->present [FRAME_SEQ])
zmq_msg_close (msg);
zmq_msg_init_size (msg, 8);

byte *source = zmq_msg_data (msg);
source [0] = (byte) ((sequence >> 56) & 255);
source [1] = (byte) ((sequence >> 48) & 255);
source [2] = (byte) ((sequence >> 40) & 255);
source [3] = (byte) ((sequence >> 32) & 255);
source [4] = (byte) ((sequence >> 24) & 255);
source [5] = (byte) ((sequence >> 16) & 255);
source [6] = (byte) ((sequence >> 8) & 255);
source [7] = (byte) ((sequence) & 255);

self->present [FRAME_SEQ] = 1;
}

// ---------------------------------------------------------------------
// Set message body

void
kvmsg_set_body (kvmsg_t *self, byte *body, size_t size)
{
assert (self);
zmq_msg_t *msg = &self->frame [FRAME_BODY];
if (self->present [FRAME_BODY])
zmq_msg_close (msg);
self->present [FRAME_BODY] = 1;
zmq_msg_init_size (msg, size);
memcpy (zmq_msg_data (msg), body, size);
}

// ---------------------------------------------------------------------
// Set message key using printf format

void
kvmsg_fmt_key (kvmsg_t *self, char *format, …)
{
char value [KVMSG_KEY_MAX + 1];
va_list args;

assert (self);
va_start (args, format);
vsnprintf (value, KVMSG_KEY_MAX, format, args);
va_end (args);
kvmsg_set_key (self, value);
}

// ---------------------------------------------------------------------
// Set message body using printf format

void
kvmsg_fmt_body (kvmsg_t *self, char *format, …)
{
char value [255 + 1];
va_list args;

assert (self);
va_start (args, format);
vsnprintf (value, 255, format, args);
va_end (args);
kvmsg_set_body (self, (byte *) value, strlen (value));
}

// ---------------------------------------------------------------------
// Store entire kvmsg into hash map, if key/value are set
// Nullifies kvmsg reference, and destroys automatically when no longer
// needed.

void
kvmsg_store (kvmsg_t **self_p, zhash_t *hash)
{
assert (self_p);
if (*self_p) {
kvmsg_t *self = *self_p;
assert (self);
if (self->present [FRAME_KEY]
&& self->present [FRAME_BODY]) {
zhash_update (hash, kvmsg_key (self), self);
zhash_freefn (hash, kvmsg_key (self), kvmsg_free);
}
*self_p = NULL;
}
}

// ---------------------------------------------------------------------
// Dump message to stderr, for debugging and tracing

void
kvmsg_dump (kvmsg_t *self)
{
if (self) {
if (!self) {
fprintf (stderr, "NULL");
return;
}
size_t size = kvmsg_size (self);
byte *body = kvmsg_body (self);
fprintf (stderr, "[seq:%" PRId64 "]", kvmsg_sequence (self));
fprintf (stderr, "[key:%s]", kvmsg_key (self));
fprintf (stderr, "[size:%zd] ", size);
int char_nbr;
for (char_nbr = 0; char_nbr < size; char_nbr++)
fprintf (stderr, "%02X", body [char_nbr]);
fprintf (stderr, "\n");
}
else
fprintf (stderr, "NULL message\n");
}

// ---------------------------------------------------------------------
// Runs self test of class

int
kvmsg_test (int verbose)
{
kvmsg_t
*kvmsg;

printf (" * kvmsg: ");

// Prepare our context and sockets
zctx_t *ctx = zctx_new ();
void *output = zsocket_new (ctx, ZMQ_DEALER);
int rc = zmq_bind (output, "ipc://kvmsg_selftest.ipc");
assert (rc == 0);
void *input = zsocket_new (ctx, ZMQ_DEALER);
rc = zmq_connect (input, "ipc://kvmsg_selftest.ipc");
assert (rc == 0);

zhash_t *kvmap = zhash_new ();

// Test send and receive of simple message
kvmsg = kvmsg_new (1);
kvmsg_set_key (kvmsg, "key");
kvmsg_set_body (kvmsg, (byte *) "body", 4);
if (verbose)
kvmsg_dump (kvmsg);
kvmsg_send (kvmsg, output);
kvmsg_store (&kvmsg, kvmap);

kvmsg = kvmsg_recv (input);
if (verbose)
kvmsg_dump (kvmsg);
assert (streq (kvmsg_key (kvmsg), "key"));
kvmsg_store (&kvmsg, kvmap);

// Shutdown and destroy all objects
zhash_destroy (&kvmap);
zctx_destroy (&ctx);

printf ("OK\n");
return 0;
}

Python | Ada | Basic | C++ | C# | Clojure | CL | Erlang | F# | Go | Haskell | Haxe | Java | Lua | Node.js | Objective-C | ooc | Perl | PHP | Ruby | Scala

우리는 나중에 좀 더 정교한 kvmsg class를 applications에서 사용하기 위해 만들 것입니다.

서버와 클라이언트 모두 hash tables을 관리하지만, 첫번쩨 모델에서 만일 서버보다 모든 클라이언트가 먼저 시작되고, 클라이언트들의 충돌이 전혀 없었다면 제대로 작동합니다. 안정적이진 않습니다.

Getting a Snapshot

top prev next

클라이언트가 지연(또는 복구)현상을 서버를 통해 발견 할 수 있도록 하기 위해서는 서버 상태 snapshot 을 얻어야 합니다. 우리는 "a sequenced key-value pair" 의미를 "message"로 줄인 것 처럼 "a hash table" 의미를 "state"로 줄일 수 있습니다. 서버 상태를 얻으려면, client는 REQ 소켓을 열고 명확하게 요청해야 합니다. :

이 작업을 하기위해서, 우리는 타이밍 문제를 해결해야 합니다. 상태 snapshot을 얻는 것은 snapshot이 큰 경우 아마도 상당히 오랜 특정시간이 소요됩니다. 우리는 snapshot에 정확히 업데이트를 적용해야 합니다. 그러나 서버는 우리에게 업데이트를 보낼 때를 알 수 없습니다. 한가지 방법은 subscribing을 시작하면서 첫 업데이트를 얻고, 다음 “업데이트 N에 대한 상태”를 요청하는 것입니다. 이는 실용적진 않지만 각 업데이트에 대한 하나의 snapshot을 저장하는 것을 서버에 요구하게 됩니다.

그래서 우리는 다음과 같이 클라이언트에서 동기화를 할 것 입니다. :

클라이언트는 먼저 업데이트를 subscribes(승낙or신청or예약)하고 상태 요청을 합니다. 이것은 상태가 가장 오래된 업데이트 보다 최신이란 것을 보장합니다.

클라이언트는 상태와 응답을 서버로부터 받기 위해 대기하며, 그동안 queue들은 모두 업데이트 됩니다. 그것은 단순히 그들을 읽는 것이 아니라 작업을 수행합니다: ØMQ는 우리가 HWM을 설정하지 않기 때문에 소켓 queue에서 그들queue를 유지합니다.

클라이언트가 상태 업데이트를 할 때, 업데이트를 다시 읽기 시작합니다. 그러나 그것은 상태 업데이트 보다 더 오래된 모든 업데이트는 버립니다. 그래서 상태 업데이트가 200까지 업데이트를 포함한다면, 클라이언트는 201까지 업데이트를 버릴 것 입니다.

클라이언트는 자체 상태 snapshot으로 업데이트를 적용합니다

이것은ØMQ 자신의 내부 queues를 이용하는 간단한 모델입니다. 여기 서버는 다음과 같습니다. :

clonesrv2: Clone server, Model Two in C

//
// Clone server Model Two
//

// Lets us build this source without creating a library
#include "kvsimple.c"

static int s_send_single (char *key, void *data, void *args);
static void state_manager (void *args, zctx_t *ctx, void *pipe);

int main (void)
{
// Prepare our context and sockets
zctx_t *ctx = zctx_new ();
void *publisher = zsocket_new (ctx, ZMQ_PUB);
zsocket_bind (publisher, "tcp://*:5557");

int64_t sequence = 0;
srandom ((unsigned) time (NULL));

// Start state manager and wait for synchronization signal
void *updates = zthread_fork (ctx, state_manager, NULL);
free (zstr_recv (updates));

while (!zctx_interrupted) {
// Distribute as key-value message
kvmsg_t *kvmsg = kvmsg_new (++sequence);
kvmsg_fmt_key (kvmsg, "%d", randof (10000));
kvmsg_fmt_body (kvmsg, "%d", randof (1000000));
kvmsg_send (kvmsg, publisher);
kvmsg_send (kvmsg, updates);
kvmsg_destroy (&kvmsg);
}
printf (" Interrupted\n%d messages out\n", (int) sequence);
zctx_destroy (&ctx);
return 0;
}

// Routing information for a key-value snapshot
typedef struct {
void *socket; // ROUTER socket to send to
zframe_t *identity; // Identity of peer who requested state
} kvroute_t;

// Send one state snapshot key-value pair to a socket
// Hash item data is our kvmsg object, ready to send
static int
s_send_single (char *key, void *data, void *args)
{
kvroute_t *kvroute = (kvroute_t *) args;
// Send identity of recipient first
zframe_send (&kvroute->identity,
kvroute->socket, ZFRAME_MORE + ZFRAME_REUSE);
kvmsg_t *kvmsg = (kvmsg_t *) data;
kvmsg_send (kvmsg, kvroute->socket);
return 0;
}

// This thread maintains the state and handles requests from
// clients for snapshots.
//
static void
state_manager (void *args, zctx_t *ctx, void *pipe)
{
zhash_t *kvmap = zhash_new ();

zstr_send (pipe, "READY");
void *snapshot = zsocket_new (ctx, ZMQ_ROUTER);
zsocket_bind (snapshot, "tcp://*:5556");

zmq_pollitem_t items [] = {
{ pipe, 0, ZMQ_POLLIN, 0 },
{ snapshot, 0, ZMQ_POLLIN, 0 }
};
int64_t sequence = 0; // Current snapshot version number
while (!zctx_interrupted) {
int rc = zmq_poll (items, 2, -1);
if (rc == -1 && errno == ETERM)
break; // Context has been shut down

// Apply state update from main thread
if (items [0].revents & ZMQ_POLLIN) {
kvmsg_t *kvmsg = kvmsg_recv (pipe);
if (!kvmsg)
break; // Interrupted
sequence = kvmsg_sequence (kvmsg);
kvmsg_store (&kvmsg, kvmap);
}
// Execute state snapshot request
if (items [1].revents & ZMQ_POLLIN) {
zframe_t *identity = zframe_recv (snapshot);
if (!identity)
break; // Interrupted

// Request is in second frame of message
char *request = zstr_recv (snapshot);
if (streq (request, "ICANHAZ?"))
free (request);
else {
printf ("E: bad request, aborting\n");
break;
}
// Send state snapshot to client
kvroute_t routing = { snapshot, identity };

// For each entry in kvmap, send kvmsg to client
zhash_foreach (kvmap, s_send_single, &routing);

// Now send END message with sequence number
printf ("Sending state shapshot=%d\n", (int) sequence);
zframe_send (&identity, snapshot, ZFRAME_MORE);
kvmsg_t *kvmsg = kvmsg_new (sequence);
kvmsg_set_key (kvmsg, "KTHXBAI");
kvmsg_set_body (kvmsg, (byte *) "", 0);
kvmsg_send (kvmsg, snapshot);
kvmsg_destroy (&kvmsg);
}
}
zhash_destroy (&kvmap);
}

Python | Ada | Basic | C++ | C# | Clojure | CL | Erlang | F# | Go | Haskell | Haxe | Java | Lua | Node.js | Objective-C | ooc | Perl | PHP | Ruby | Scala

클라이언트 입니다.:

clonecli2: Clone client, Model Two in C

Python | Ada | Basic | C++ | C# | Clojure | CL | Erlang | F# | Go | Haskell | Haxe | Java | Lua | Node.js | Objective-C | ooc | Perl | PHP | Ruby | Scala

이 코드들에 대한 몇 가지 요약입니다. :

서버는 단순한 설계를 위해 두 개의 스레드를 사용합니다. 한 스레드는 임의 업데이트를 수행하고, 두 번째 스레드는 상태를 처리합니다. 두 스레드는 PAIR 소켓을 통하여 통신합니다. 당신은 SUB 소켓을 사용할 수 있지만. 연결하는 동안 subscriber가 무작위로 몇 가지 메시지를 놓치는 “"slow joiner" 문제에 부딪칠 것입니다 PAIR 소켓은 두 개의 스레드를 명확히 동기화 시킵니다.

hash table 삽입이 상대적으로 느리기 때문에 우리는 업데이트한 한 쌍의 소켓에 HWM을 설정합니다. 이것이 없으면, 서버의 out of memory가 발생합니다. inproc 연결에서 실제 HWM은 두 소켓의 HWM의 합계이며, 그래서 우리는 각 소켓에 HWM을 설정합니다.

클라이언트는 정말 간단합니다. C에서, 코드는 60 라인 이하입니다. 많은 어려운 부분은 kvmsg 클래스에서 수행하지만, 여전히 기본적인 Clone pattern 은 처음에 보였던 것보다 쉽게 구현됩니다.

우리는 직렬화 상태에 대한 멋진 어떤것도 사용하지 않습니다. hash table 은 kvmsg 개체의 집합을 보유하고, 서버가 클라이언트 요청 상태 메시지의 일괄 처리로 이들을 보냅니다. 다수의 클라이언트가 동시에 상태를 요청하는 경우, 각각 다른 snapshot을 얻을 것입니다

우리는 클라이언트가 할 얘기가 정확히 하나의 서버가 실행이 되고 있다고 가정합니다. : 우리는 서버가 충돌할 때 무엇이 발생하는지에 대한 질문을 답하지는 않을 것입니다..

지금, 이 두 프로그램은 진짜 아무것도 하지 않지만, 그들은 정확하게 상태를 동기화할 수 있습니다. 이것은 다른 패턴을 결합하는 방법의 적절한 사례입니다. PAIR-over-inproc, PUB-SUB, and ROUTER-DEALER.

Republishing Updates

top prev next

두 번째 모델에서, 서버 자체로부터 key-value cache를 변경합니다. 이것은 우리가 각 노드에서 로컬 캐싱과 함께 배포하려는 중앙 설정 파일이 있다면 예제로서 유용한 중앙집중 모델(centralized model )입니다. 더 흥미로운 모델은 서버가 아닌 클라이언트에서 업데이트를 합니다. 서버는 이렇게 상태가 없는 브로커가 됩니다. 이것은 우리에게 몇가지 장점을 제공합니다. :

우리는 서버의 안정성에 대해 좀 덜 걱정하게 합니다. 충돌이 발생하는 경우, 우리는 새 인스턴스를 시작하고 새로운 값을 줄 수 있습니다.
우리는 동적인 peers간의 지식을 공유하는 key-value cache를 사용할 수 있습니다.

클라이언트로부터의 업데이트는 클라이언트에서 서버로 PUSH-PULL 소켓 흐름을 통해 이동합니다. :

왜 클라이언트가 다른 클라이언트에게 직접 업데이트를 게시(publish)하는 것을 허용하지 않을까요? 이것이 지연시간을 줄일 것이지만, 그것이 메시지에게 고유한 시퀀스 번호를 오름차순으로 할당하는 것은 불가능하게 만듭니다. 서버가 이 작업을 수행할 수 있습니다. 더 미묘한 두 번째 이유가 있습니다. 많은 응용 프로그램에서 많은 클라이언트에 걸쳐 업데이트를 단일 명령으로 하는 것은 중요합니다. 서버를 통해 모든 업데이트를 강행하는 것은 결국 클라이언트에 도달했을 동일한 명령이 수행된 것을 보장하는 것입니다.

고유의 시퀀스를 통해 클라이언트는 애먹이는 오류를 감지할 수 있습니다 - 네트워크 혼잡 및 큐 오버플로 입니다. 만일 클라이언트가 수신 메시지 스트림의 결함을 발견하면, 그것은 조치를 취할 수 있습니다. 이것은 클라이언트가 서버에 접속하여 누락된 메시지를 요청하듯 현명한 것 같지만, 실제로 그렇게 유용하지 않습니다. 만일 결함(hole)이 있다면, 그들은 네트워크 스트레스에 의해 발생하고 있으며, 네트워크에 더 많은 스트레스를 추가하면 상황은 악화 되기만 합니다. 모든 클라이언트는 정말 "계속 할 수 없습니다", 중지하고, 누군가가 수동으로 문제의 원인을 확인하기 전까지는 다시 시작되지 않습니다 라고 사용자에게 경고 할 수 있습니다.

우리는 이제 클라이언트에서 상태 업데이트를 생성하실 수 있습니다. 서버는 다음과 같습니다. :

clonesrv3: Clone server, Model Three in C

//
// Clone server Model Three
//

// Lets us build this source without creating a library
#include "kvsimple.c"

static int s_send_single (char *key, void *data, void *args);

// Routing information for a key-value snapshot
typedef struct {
void *socket; // ROUTER socket to send to
zframe_t *identity; // Identity of peer who requested state
} kvroute_t;

int main (void)
{
// Prepare our context and sockets
zctx_t *ctx = zctx_new ();
void *snapshot = zsocket_new (ctx, ZMQ_ROUTER);
zsocket_bind (snapshot, "tcp://*:5556");
void *publisher = zsocket_new (ctx, ZMQ_PUB);
zsocket_bind (publisher, "tcp://*:5557");
void *collector = zsocket_new (ctx, ZMQ_PULL);
zsocket_bind (collector, "tcp://*:5558");

int64_t sequence = 0;
zhash_t *kvmap = zhash_new ();

zmq_pollitem_t items [] = {
{ collector, 0, ZMQ_POLLIN, 0 },
{ snapshot, 0, ZMQ_POLLIN, 0 }
};
while (!zctx_interrupted) {
int rc = zmq_poll (items, 2, 1000 * ZMQ_POLL_MSEC);

// Apply state update sent from client
if (items [0].revents & ZMQ_POLLIN) {
kvmsg_t *kvmsg = kvmsg_recv (collector);
if (!kvmsg)
break; // Interrupted
kvmsg_set_sequence (kvmsg, ++sequence);
kvmsg_send (kvmsg, publisher);
kvmsg_store (&kvmsg, kvmap);
printf ("I: publishing update %5d\n", (int) sequence);
}
// Execute state snapshot request
if (items [1].revents & ZMQ_POLLIN) {
zframe_t *identity = zframe_recv (snapshot);
if (!identity)
break; // Interrupted

// For each entry in kvmap, send kvmsg to client
zhash_foreach (kvmap, s_send_single, &routing);

// Now send END message with sequence number
printf ("I: sending shapshot=%d\n", (int) sequence);
zframe_send (&identity, snapshot, ZFRAME_MORE);
kvmsg_t *kvmsg = kvmsg_new (sequence);
kvmsg_set_key (kvmsg, "KTHXBAI");
kvmsg_set_body (kvmsg, (byte *) "", 0);
kvmsg_send (kvmsg, snapshot);
kvmsg_destroy (&kvmsg);
}
}
printf (" Interrupted\n%d messages handled\n", (int) sequence);
zhash_destroy (&kvmap);
zctx_destroy (&ctx);

return 0;
}

Python | Ada | Basic | C++ | C# | Clojure | CL | Erlang | F# | Go | Haskell | Haxe | Java | Lua | Node.js | Objective-C | ooc | Perl | PHP | Ruby | Scala

이것은 클라이언트입니다. :

clonecli3: Clone client, Model Three in C

//
// Clone client Model Three
//

// Lets us build this source without creating a library
#include "kvsimple.c"

int main (void)
{
// Prepare our context and subscriber
zctx_t *ctx = zctx_new ();
void *snapshot = zsocket_new (ctx, ZMQ_DEALER);
zsocket_connect (snapshot, "tcp://localhost:5556");
void *subscriber = zsocket_new (ctx, ZMQ_SUB);
zsocket_connect (subscriber, "tcp://localhost:5557");
void *publisher = zsocket_new (ctx, ZMQ_PUSH);
zsocket_connect (publisher, "tcp://localhost:5558");

zhash_t *kvmap = zhash_new ();
srandom ((unsigned) time (NULL));

// Get state snapshot
int64_t sequence = 0;
zstr_send (snapshot, "ICANHAZ?");
while (TRUE) {
kvmsg_t *kvmsg = kvmsg_recv (snapshot);
if (!kvmsg)
break; // Interrupted
if (streq (kvmsg_key (kvmsg), "KTHXBAI")) {
sequence = kvmsg_sequence (kvmsg);
printf ("I: received snapshot=%d\n", (int) sequence);
kvmsg_destroy (&kvmsg);
break; // Done
}
kvmsg_store (&kvmsg, kvmap);
}
int64_t alarm = zclock_time () + 1000;
while (!zctx_interrupted) {
zmq_pollitem_t items [] = { { subscriber, 0, ZMQ_POLLIN, 0 } };
int tickless = (int) ((alarm - zclock_time ()));
if (tickless < 0)
tickless = 0;
int rc = zmq_poll (items, 1, tickless * ZMQ_POLL_MSEC);
if (rc == -1)
break; // Context has been shut down

if (items [0].revents & ZMQ_POLLIN) {
kvmsg_t *kvmsg = kvmsg_recv (subscriber);
if (!kvmsg)
break; // Interrupted

// Discard out-of-sequence kvmsgs, incl. heartbeats
if (kvmsg_sequence (kvmsg) > sequence) {
sequence = kvmsg_sequence (kvmsg);
kvmsg_store (&kvmsg, kvmap);
printf ("I: received update=%d\n", (int) sequence);
}
else
kvmsg_destroy (&kvmsg);
}
// If we timed-out, generate a random kvmsg
if (zclock_time () >= alarm) {
kvmsg_t *kvmsg = kvmsg_new (0);
kvmsg_fmt_key (kvmsg, "%d", randof (10000));
kvmsg_fmt_body (kvmsg, "%d", randof (1000000));
kvmsg_send (kvmsg, publisher);
kvmsg_destroy (&kvmsg);
alarm = zclock_time () + 1000;
}
}
printf (" Interrupted\n%d messages in\n", (int) sequence);
zhash_destroy (&kvmap);
zctx_destroy (&ctx);
return 0;
}

Python | Ada | Basic | C++ | C# | Clojure | CL | Erlang | F# | Go | Haskell | Haxe | Java | Lua | Node.js | Objective-C | ooc | Perl | PHP | Ruby | Scala

이 코드에 대한 몇 가지 참고 사항 :

서버는 클라이언트에서 업데이트를 수집하고 그들을 재 배포하는 하나의 스레드로 나뉘게 됩니다. 그것은 수신되는 업데이트에 대한 PULL 소켓, 상태 요청에 대한 ROUTER 소켓, 발신 업데이트에 대한 PUB 소켓을 관리합니다.

클라이언트는 일초에 한번 서버에 임의의 업데이트를 전송하는 단순하고 소리없는 타이머를 사용합니다. 실제는 업데이트가 응용 프로그램 코드에 의해 구동됩니다

Clone Subtrees

top prev next

실질적인 key-value cache는 다수(다량)의 것을 얻을 것이며, 클라이언트는 일반적으로 cache의 일부에 관심을 가질 것입니다. 하위트리(subtree)로 작업하는 것은 상당히 간단합니다. 클라이언트는 상태 요청을 보낼 때 서버 subtree에게 전달하며, 그것이 업데이트를 동의하면 동일한 subtree를 지정합니다.

trees에 대한 두 가지 공통 구문이 있습니다. 하나는 "경로 계층 구조(path hierarchy) "이며, 다른 하나는 "항목 트리(topic tree) "입니다. 이것은 이래와 같습니다. :

Path hierarchy: "/some/list/of/paths"
Topic tree: "some.list.of.topics"

우리는 path hierarchy를 사용할 것이고, 클라이언트는 단일 subtree와 함께 작업할 수 있도록 클라이언트와 서버를 확장합니다. 다수의 subtree로 작업하는 것은 어렵지 않으며, 여기서 보여 주지는 않지만 간단합니다.

여기 모델3을 조금 변경한 서버 입니다. :

clonesrv4: Clone server, Model Four in C

//
// Clone server Model Four
//

// Lets us build this source without creating a library
#include "kvsimple.c"

static int s_send_single (char *key, void *data, void *args);

// Routing information for a key-value snapshot
typedef struct {
void *socket; // ROUTER socket to send to
zframe_t *identity; // Identity of peer who requested state
char *subtree; // Client subtree specification
} kvroute_t;

int64_t sequence = 0;
zhash_t *kvmap = zhash_new ();

zmq_pollitem_t items [] = {
{ collector, 0, ZMQ_POLLIN, 0 },
{ snapshot, 0, ZMQ_POLLIN, 0 }
};
while (!zctx_interrupted) {
int rc = zmq_poll (items, 2, 1000 * ZMQ_POLL_MSEC);

// Request is in second frame of message
char *request = zstr_recv (snapshot);
char *subtree = NULL;
if (streq (request, "ICANHAZ?")) {
free (request);
subtree = zstr_recv (snapshot);
}
else {
printf ("E: bad request, aborting\n");
break;
}
// Send state snapshot to client
kvroute_t routing = { snapshot, identity, subtree };

// For each entry in kvmap, send kvmsg to client
zhash_foreach (kvmap, s_send_single, &routing);

// Now send END message with sequence number
printf ("I: sending shapshot=%d\n", (int) sequence);
zframe_send (&identity, snapshot, ZFRAME_MORE);
kvmsg_t *kvmsg = kvmsg_new (sequence);
kvmsg_set_key (kvmsg, "KTHXBAI");
kvmsg_set_body (kvmsg, (byte *) subtree, 0);
kvmsg_send (kvmsg, snapshot);
kvmsg_destroy (&kvmsg);
free (subtree);
}
}
printf (" Interrupted\n%d messages handled\n", (int) sequence);
zhash_destroy (&kvmap);
zctx_destroy (&ctx);

return 0;
}

// Send one state snapshot key-value pair to a socket
// Hash item data is our kvmsg object, ready to send
static int
s_send_single (char *key, void *data, void *args)
{
kvroute_t *kvroute = (kvroute_t *) args;
kvmsg_t *kvmsg = (kvmsg_t *) data;
if (strlen (kvroute->subtree) <= strlen (kvmsg_key (kvmsg))
&& memcmp (kvroute->subtree,
kvmsg_key (kvmsg), strlen (kvroute->subtree)) == 0) {
// Send identity of recipient first
zframe_send (&kvroute->identity,
kvroute->socket, ZFRAME_MORE + ZFRAME_REUSE);
kvmsg_send (kvmsg, kvroute->socket);
}
return 0;
}

Python | Ada | Basic | C++ | C# | Clojure | CL | Erlang | F# | Go | Haskell | Haxe | Java | Lua | Node.js | Objective-C | ooc | Perl | PHP | Ruby | Scala

클라이언트입니다. :

clonecli4: Clone client, Model Four in C

//
// Clone client Model Four
//

// Lets us build this source without creating a library
#include "kvsimple.c"

#define SUBTREE "/client/"

int main (void)
{
// Prepare our context and subscriber
zctx_t *ctx = zctx_new ();
void *snapshot = zsocket_new (ctx, ZMQ_DEALER);
zsocket_connect (snapshot, "tcp://localhost:5556");
void *subscriber = zsocket_new (ctx, ZMQ_SUB);
zsocket_connect (subscriber, "tcp://localhost:5557");
zsockopt_set_subscribe (subscriber, SUBTREE);
void *publisher = zsocket_new (ctx, ZMQ_PUSH);
zsocket_connect (publisher, "tcp://localhost:5558");

zhash_t *kvmap = zhash_new ();
srandom ((unsigned) time (NULL));

// Get state snapshot
int64_t sequence = 0;
zstr_sendm (snapshot, "ICANHAZ?");
zstr_send (snapshot, SUBTREE);
while (TRUE) {
kvmsg_t *kvmsg = kvmsg_recv (snapshot);
if (!kvmsg)
break; // Interrupted
if (streq (kvmsg_key (kvmsg), "KTHXBAI")) {
sequence = kvmsg_sequence (kvmsg);
printf ("I: received snapshot=%d\n", (int) sequence);
kvmsg_destroy (&kvmsg);
break; // Done
}
kvmsg_store (&kvmsg, kvmap);
}

int64_t alarm = zclock_time () + 1000;
while (!zctx_interrupted) {
zmq_pollitem_t items [] = { { subscriber, 0, ZMQ_POLLIN, 0 } };
int tickless = (int) ((alarm - zclock_time ()));
if (tickless < 0)
tickless = 0;
int rc = zmq_poll (items, 1, tickless * ZMQ_POLL_MSEC);
if (rc == -1)
break; // Context has been shut down

if (items [0].revents & ZMQ_POLLIN) {
kvmsg_t *kvmsg = kvmsg_recv (subscriber);
if (!kvmsg)
break; // Interrupted

// Discard out-of-sequence kvmsgs, incl. heartbeats
if (kvmsg_sequence (kvmsg) > sequence) {
sequence = kvmsg_sequence (kvmsg);
kvmsg_store (&kvmsg, kvmap);
printf ("I: received update=%d\n", (int) sequence);
}
else
kvmsg_destroy (&kvmsg);
}
// If we timed-out, generate a random kvmsg
if (zclock_time () >= alarm) {
kvmsg_t *kvmsg = kvmsg_new (0);
kvmsg_fmt_key (kvmsg, "%s%d", SUBTREE, randof (10000));
kvmsg_fmt_body (kvmsg, "%d", randof (1000000));
kvmsg_send (kvmsg, publisher);
kvmsg_destroy (&kvmsg);
alarm = zclock_time () + 1000;
}
}
printf (" Interrupted\n%d messages in\n", (int) sequence);
zhash_destroy (&kvmap);
zctx_destroy (&ctx);
return 0;
}

Python | Ada | Basic | C++ | C# | Clojure | CL | Erlang | F# | Go | Haskell | Haxe | Java | Lua | Node.js | Objective-C | ooc | Perl | PHP | Ruby | Scala

Ephemeral Values

top prev next

동적으로 만료되는 임시값은 하나입니다.. 당신이 DNS와 같은 서비스를 위해 복제를 생각한다면, 임시 값은 동적 DNS를 만들도록 할 것입니다. 노드는 네트워크를 연결하고, 그것의 주소를 할당하고며, 정기적으로 확인합니다. 만일 노드가 죽으면, 그 주소는 결국 제거됩니다.

임시 값에 대한 일반적인 개념는 "세션"에 연결하고, 세션이 종료될 때 삭제하는 것입니다. Clone에서는 세션이 클라이언트에 의해 정의 될 것이며, 클라이언트가 세션을 끊으면 종료될 것입니다.

세션을 사용하는 단순 대안은 값이 종료될 때 서버에게 알려주는 "time to live"와 함께 모든 임시 값을 정의하는 것입니다. 클라이언트는 값을 재생하고, 만일 그들이 하지 않으면 값이 종료됩니다.

우리가 아직은 좀 더 복잡한 모델을 만들만한 가치가 있는지 모르기 때문에 간단한 모델을 구현하려고 합니다. 차이점은 성능일 뿐입니다. 만일 클라이언트가 소수의 임시 값을 갖고 있다면, 그것은 각각 하나 TTL을 설정하는 것이 좋습니다. 만일 클라이언트가 임시 값을 다수 사용한다면, 한번에 그들을 세션에 연결하고, 종료 시키는데 더 효율적입니다.

우선, key-value 메시지에 TTL을 인코딩하는 방법이 필요합니다. 우리는 프레임을 추가할 수 있습니다. 속성에 대한 프레임을 이용시의 문제점은 우리가 새로운 속성을 추가할 때마다, 우리는 kvmsg 클래스의 구조를 변경해야 한다는 것입니다. 그것은 호환성을 깨트립니다. 그래서 메시지에 'properties' 프레임을 추가하고, 속성 값을 얻고 넣을 수 있게 코드합니다.

다음으로, "delete this value"라고 하는 방법이 필요합니다. 지금까지 서버와 클라이언트는 항상 그들의 hash table에 맹목적으로 새로운 값을 삽입하거나 업데이트 했습니다. 만일 값이 비어있다면 그것은 "delete this key”를 의미하는 것입니다.

여기에 'properties'프레임 (우리가 나중에 필요한 UUID 프레임을, 추가)를 구현한 kvmsg 클래스의 보다 완전한 버전 있습니다. 필요한 경우, 해시에서 키를 삭제하여 빈 값을 처리합니다. :

kvmsg: Key-value message class - full in C

/* =====================================================================
kvmsg - key-value message class for example applications

---------------------------------------------------------------------
Copyright (c) 1991-2011 iMatix Corporation <www.imatix.com>
Copyright other contributors as noted in the AUTHORS file.

This file is part of the ZeroMQ Guide: http://zguide.zeromq.org

// Keys are short strings
#define KVMSG_KEY_MAX 255

// Message is formatted on wire as 4 frames:
// frame 0: key (0MQ string)
// frame 1: sequence (8 bytes, network order)
// frame 2: uuid (blob, 16 bytes)
// frame 3: properties (0MQ string)
// frame 4: body (blob)
#define FRAME_KEY 0
#define FRAME_SEQ 1
#define FRAME_UUID 2
#define FRAME_PROPS 3
#define FRAME_BODY 4
#define KVMSG_FRAMES 5

// Serialize list of properties to a message frame
static void
s_encode_props (kvmsg_t *self)
{
zmq_msg_t *msg = &self->frame [FRAME_PROPS];
if (self->present [FRAME_PROPS])
zmq_msg_close (msg);

zmq_msg_init_size (msg, self->props_size);
char *prop = zlist_first (self->props);
char *dest = (char *) zmq_msg_data (msg);
while (prop) {
strcpy (dest, prop);
dest += strlen (prop);
*dest++ = '\n';
prop = zlist_next (self->props);
}
self->present [FRAME_PROPS] = 1;
}

// Rebuild properties list from message frame
static void
s_decode_props (kvmsg_t *self)
{
zmq_msg_t *msg = &self->frame [FRAME_PROPS];
self->props_size = 0;
while (zlist_size (self->props))
free (zlist_pop (self->props));

size_t remainder = zmq_msg_size (msg);
char *prop = (char *) zmq_msg_data (msg);
char *eoln = memchr (prop, '\n', remainder);
while (eoln) {
*eoln = 0;
zlist_append (self->props, strdup (prop));
self->props_size += strlen (prop) + 1;
remainder -= strlen (prop) + 1;
prop = eoln + 1;
eoln = memchr (prop, '\n', remainder);
}
}

// ---------------------------------------------------------------------
// Constructor, sets sequence as provided

kvmsg_t *
kvmsg_new (int64_t sequence)
{
kvmsg_t
*self;

self = (kvmsg_t *) zmalloc (sizeof (kvmsg_t));
self->props = zlist_new ();
kvmsg_set_sequence (self, sequence);
return self;
}

// ---------------------------------------------------------------------
// Destructor

// Destroy property list
while (zlist_size (self->props))
free (zlist_pop (self->props));
zlist_destroy (&self->props);

// Free object itself
free (self);
}
}

void
kvmsg_destroy (kvmsg_t **self_p)
{
assert (self_p);
if (*self_p) {
kvmsg_free (*self_p);
*self_p = NULL;
}
}

// ---------------------------------------------------------------------
// Create duplicate of kvmsg

kvmsg_t *
kvmsg_dup (kvmsg_t *self)
{
kvmsg_t *kvmsg = kvmsg_new (0);
int frame_nbr;
for (frame_nbr = 0; frame_nbr < KVMSG_FRAMES; frame_nbr++) {
if (self->present [frame_nbr]) {
zmq_msg_t *src = &self->frame [frame_nbr];
zmq_msg_t *dst = &kvmsg->frame [frame_nbr];
zmq_msg_init_size (dst, zmq_msg_size (src));
memcpy (zmq_msg_data (dst),
zmq_msg_data (src), zmq_msg_size (src));
kvmsg->present [frame_nbr] = 1;
}
}
kvmsg->props = zlist_copy (self->props);
return kvmsg;
}

// ---------------------------------------------------------------------
// Reads key-value message from socket, returns new kvmsg instance.

kvmsg_t *
kvmsg_recv (void *socket)
{
assert (socket);
kvmsg_t *self = kvmsg_new (0);

// ---------------------------------------------------------------------
// Send key-value message to socket; any empty frames are sent as such.

void
kvmsg_send (kvmsg_t *self, void *socket)
{
assert (self);
assert (socket);

s_encode_props (self);
int frame_nbr;
for (frame_nbr = 0; frame_nbr < KVMSG_FRAMES; frame_nbr++) {
zmq_msg_t copy;
zmq_msg_init (&copy);
if (self->present [frame_nbr])
zmq_msg_copy (&copy, &self->frame [frame_nbr]);
zmq_sendmsg (socket, &copy,
(frame_nbr < KVMSG_FRAMES - 1)? ZMQ_SNDMORE: 0);
zmq_msg_close (&copy);
}
}

// ---------------------------------------------------------------------
// Return key from last read message, if any, else NULL

// ---------------------------------------------------------------------
// Return sequence nbr from last read message, if any

// ---------------------------------------------------------------------
// Return UUID from last read message, if any, else NULL

byte *
kvmsg_uuid (kvmsg_t *self)
{
assert (self);
if (self->present [FRAME_UUID]
&& zmq_msg_size (&self->frame [FRAME_UUID]) == sizeof (uuid_t))
return (byte *) zmq_msg_data (&self->frame [FRAME_UUID]);
else
return NULL;
}

// ---------------------------------------------------------------------
// Return body from last read message, if any, else NULL

byte *
kvmsg_body (kvmsg_t *self)
{
assert (self);
if (self->present [FRAME_BODY])
return (byte *) zmq_msg_data (&self->frame [FRAME_BODY]);
else
return NULL;
}

// ---------------------------------------------------------------------
// Return body size from last read message, if any, else zero

size_t
kvmsg_size (kvmsg_t *self)
{
assert (self);
if (self->present [FRAME_BODY])
return zmq_msg_size (&self->frame [FRAME_BODY]);
else
return 0;
}

// ---------------------------------------------------------------------
// Set message key as provided

// ---------------------------------------------------------------------
// Set message sequence number

void
kvmsg_set_sequence (kvmsg_t *self, int64_t sequence)
{
assert (self);
zmq_msg_t *msg = &self->frame [FRAME_SEQ];
if (self->present [FRAME_SEQ])
zmq_msg_close (msg);
zmq_msg_init_size (msg, 8);

self->present [FRAME_SEQ] = 1;
}

// ---------------------------------------------------------------------
// Set message UUID to generated value

void
kvmsg_set_uuid (kvmsg_t *self)
{
assert (self);
zmq_msg_t *msg = &self->frame [FRAME_UUID];
uuid_t uuid;
uuid_generate (uuid);
if (self->present [FRAME_UUID])
zmq_msg_close (msg);
zmq_msg_init_size (msg, sizeof (uuid));
memcpy (zmq_msg_data (msg), uuid, sizeof (uuid));
self->present [FRAME_UUID] = 1;
}

// ---------------------------------------------------------------------
// Set message body

// ---------------------------------------------------------------------
// Set message key using printf format

void
kvmsg_fmt_key (kvmsg_t *self, char *format, …)
{
char value [KVMSG_KEY_MAX + 1];
va_list args;

assert (self);
va_start (args, format);
vsnprintf (value, KVMSG_KEY_MAX, format, args);
va_end (args);
kvmsg_set_key (self, value);
}

// ---------------------------------------------------------------------
// Set message body using printf format

void
kvmsg_fmt_body (kvmsg_t *self, char *format, …)
{
char value [255 + 1];
va_list args;

assert (self);
va_start (args, format);
vsnprintf (value, 255, format, args);
va_end (args);
kvmsg_set_body (self, (byte *) value, strlen (value));
}

// ---------------------------------------------------------------------
// Get message property, if set, else ""

char *
kvmsg_get_prop (kvmsg_t *self, char *name)
{
assert (strchr (name, '=') == NULL);
char *prop = zlist_first (self->props);
size_t namelen = strlen (name);
while (prop) {
if (strlen (prop) > namelen
&& memcmp (prop, name, namelen) == 0
&& prop [namelen] == '=')
return prop + namelen + 1;
prop = zlist_next (self->props);
}
return "";
}

// ---------------------------------------------------------------------
// Set message property
// Names cannot contain '='. Max length of value is 255 chars.

void
kvmsg_set_prop (kvmsg_t *self, char *name, char *format, …)
{
assert (strchr (name, '=') == NULL);

char value [255 + 1];
va_list args;
assert (self);
va_start (args, format);
vsnprintf (value, 255, format, args);
va_end (args);

// Allocate name=value string
char *prop = malloc (strlen (name) + strlen (value) + 2);

// Remove existing property if any
sprintf (prop, "%s=", name);
char *existing = zlist_first (self->props);
while (existing) {
if (memcmp (prop, existing, strlen (prop)) == 0) {
self->props_size -= strlen (existing) + 1;
zlist_remove (self->props, existing);
free (existing);
break;
}
existing = zlist_next (self->props);
}
// Add new name=value property string
strcat (prop, value);
zlist_append (self->props, prop);
self->props_size += strlen (prop) + 1;
}

// ---------------------------------------------------------------------
// Store entire kvmsg into hash map, if key/value are set.
// Nullifies kvmsg reference, and destroys automatically when no longer
// needed. If value is empty, deletes any previous value from store.

void
kvmsg_store (kvmsg_t **self_p, zhash_t *hash)
{
assert (self_p);
if (*self_p) {
kvmsg_t *self = *self_p;
assert (self);
if (kvmsg_size (self)) {
if (self->present [FRAME_KEY]
&& self->present [FRAME_BODY]) {
zhash_update (hash, kvmsg_key (self), self);
zhash_freefn (hash, kvmsg_key (self), kvmsg_free);
}
}
else
zhash_delete (hash, kvmsg_key (self));

*self_p = NULL;
}
}

// ---------------------------------------------------------------------
// Dump message to stderr, for debugging and tracing

void
kvmsg_dump (kvmsg_t *self)
{
if (self) {
if (!self) {
fprintf (stderr, "NULL");
return;
}
size_t size = kvmsg_size (self);
byte *body = kvmsg_body (self);
fprintf (stderr, "[seq:%" PRId64 "]", kvmsg_sequence (self));
fprintf (stderr, "[key:%s]", kvmsg_key (self));
fprintf (stderr, "[size:%zd] ", size);
if (zlist_size (self->props)) {
fprintf (stderr, "[");
char *prop = zlist_first (self->props);
while (prop) {
fprintf (stderr, "%s;", prop);
prop = zlist_next (self->props);
}
fprintf (stderr, "]");
}
int char_nbr;
for (char_nbr = 0; char_nbr < size; char_nbr++)
fprintf (stderr, "%02X", body [char_nbr]);
fprintf (stderr, "\n");
}
else
fprintf (stderr, "NULL message\n");
}

// ---------------------------------------------------------------------
// Runs self test of class

int
kvmsg_test (int verbose)
{
kvmsg_t
*kvmsg;

printf (" * kvmsg: ");

zhash_t *kvmap = zhash_new ();

// Test send and receive of simple message
kvmsg = kvmsg_new (1);
kvmsg_set_key (kvmsg, "key");
kvmsg_set_uuid (kvmsg);
kvmsg_set_body (kvmsg, (byte *) "body", 4);
if (verbose)
kvmsg_dump (kvmsg);
kvmsg_send (kvmsg, output);
kvmsg_store (&kvmsg, kvmap);

kvmsg = kvmsg_recv (input);
if (verbose)
kvmsg_dump (kvmsg);
assert (streq (kvmsg_key (kvmsg), "key"));
kvmsg_store (&kvmsg, kvmap);

// Test send and receive of message with properties
kvmsg = kvmsg_new (2);
kvmsg_set_prop (kvmsg, "prop1", "value1");
kvmsg_set_prop (kvmsg, "prop2", "value1");
kvmsg_set_prop (kvmsg, "prop2", "value2");
kvmsg_set_key (kvmsg, "key");
kvmsg_set_uuid (kvmsg);
kvmsg_set_body (kvmsg, (byte *) "body", 4);
assert (streq (kvmsg_get_prop (kvmsg, "prop2"), "value2"));
if (verbose)
kvmsg_dump (kvmsg);
kvmsg_send (kvmsg, output);
kvmsg_destroy (&kvmsg);

kvmsg = kvmsg_recv (input);
if (verbose)
kvmsg_dump (kvmsg);
assert (streq (kvmsg_key (kvmsg), "key"));
assert (streq (kvmsg_get_prop (kvmsg, "prop2"), "value2"));
kvmsg_destroy (&kvmsg);

// Shutdown and destroy all objects
zhash_destroy (&kvmap);
zctx_destroy (&ctx);

printf ("OK\n");
return 0;
}

Python | Ada | Basic | C++ | C# | Clojure | CL | Erlang | F# | Go | Haskell | Haxe | Java | Lua | Node.js | Objective-C | ooc | Perl | PHP | Ruby | Scala

Model5 클라이언트는 Model4와 거의 동일하지만, kvsimple대신에 전체 kvmsg 클래스를 사용하고, 각 메시지에 무작위로 'TTL'속성 (초 단위로 측정)을 설정합니다. :

kvmsg_set_prop (kvmsg, "ttl", "%d", randof (30));

Model5서버는 완전히 변화되었습니다. poll loop 대신에, 우리는 지금 reactor를 사용하고 있습니다. 이것은 타이머와 소켓 이벤트를 혼합해서 사용하는 것을 간단하게 만듭니다. C에서 reactor style은 더 많은 verbose입니다. 마일리지는 다른 언어로 바꿀 수 있습니다. 그러나 reactor는 더 복잡한 ØMQ 애플리케이션을 구축하는 더 좋은 방법 같습니다. 여기 서버는 다음과 같습니다. :

clonesrv5: Clone server, Model Five in C

//
// Clone server Model Five
//

// Lets us build this source without creating a library
#include "kvmsg.c"

// zloop reactor handlers
static int s_snapshots (zloop_t *loop, zmq_pollitem_t *poller, void *args);
static int s_collector (zloop_t *loop, zmq_pollitem_t *poller, void *args);
static int s_flush_ttl (zloop_t *loop, zmq_pollitem_t *poller, void *args);

// Our server is defined by these properties
typedef struct {
zctx_t *ctx; // Context wrapper
zhash_t *kvmap; // Key-value store
zloop_t *loop; // zloop reactor
int port; // Main port we're working on
int64_t sequence; // How many updates we're at
void *snapshot; // Handle snapshot requests
void *publisher; // Publish updates to clients
void *collector; // Collect updates from clients
} clonesrv_t;

int main (void)
{
clonesrv_t *self = (clonesrv_t *) zmalloc (sizeof (clonesrv_t));

self->port = 5556;
self->ctx = zctx_new ();
self->kvmap = zhash_new ();
self->loop = zloop_new ();
zloop_set_verbose (self->loop, FALSE);

// Set up our clone server sockets
self->snapshot = zsocket_new (self->ctx, ZMQ_ROUTER);
self->publisher = zsocket_new (self->ctx, ZMQ_PUB);
self->collector = zsocket_new (self->ctx, ZMQ_PULL);
zsocket_bind (self->snapshot, "tcp://*:%d", self->port);
zsocket_bind (self->publisher, "tcp://*:%d", self->port + 1);
zsocket_bind (self->collector, "tcp://*:%d", self->port + 2);

// Register our handlers with reactor
zmq_pollitem_t poller = { self->snapshot, 0, ZMQ_POLLIN };
zloop_poller (self->loop, &poller, s_snapshots, self);
poller.socket = self->collector;
zloop_poller (self->loop, &poller, s_collector, self);
zloop_timer (self->loop, 1000, 0, s_flush_ttl, self);

// Run reactor until process interrupted
zloop_start (self->loop);

zloop_destroy (&self->loop);
zhash_destroy (&self->kvmap);
zctx_destroy (&self->ctx);
free (self);
return 0;
}

// ---------------------------------------------------------------------
// Send snapshots to clients who ask for them

static int s_send_single (char *key, void *data, void *args);

static int
s_snapshots (zloop_t *loop, zmq_pollitem_t *poller, void *args)
{
clonesrv_t *self = (clonesrv_t *) args;

zframe_t *identity = zframe_recv (poller->socket);
if (identity) {
// Request is in second frame of message
char *request = zstr_recv (poller->socket);
char *subtree = NULL;
if (streq (request, "ICANHAZ?")) {
free (request);
subtree = zstr_recv (poller->socket);
}
else
printf ("E: bad request, aborting\n");

if (subtree) {
// Send state socket to client
kvroute_t routing = { poller->socket, identity, subtree };
zhash_foreach (self->kvmap, s_send_single, &routing);

// Now send END message with sequence number
zclock_log ("I: sending shapshot=%d", (int) self->sequence);
zframe_send (&identity, poller->socket, ZFRAME_MORE);
kvmsg_t *kvmsg = kvmsg_new (self->sequence);
kvmsg_set_key (kvmsg, "KTHXBAI");
kvmsg_set_body (kvmsg, (byte *) subtree, 0);
kvmsg_send (kvmsg, poller->socket);
kvmsg_destroy (&kvmsg);
free (subtree);
}
}
return 0;
}

// Send one state snapshot key-value pair to a socket
// Hash item data is our kvmsg object, ready to send
static int
s_send_single (char *key, void *data, void *args)
{
kvroute_t *kvroute = (kvroute_t *) args;
kvmsg_t *kvmsg = (kvmsg_t *) data;
if (strlen (kvroute->subtree) <= strlen (kvmsg_key (kvmsg))
&& memcmp (kvroute->subtree,
kvmsg_key (kvmsg), strlen (kvroute->subtree)) == 0) {
// Send identity of recipient first
zframe_send (&kvroute->identity,
kvroute->socket, ZFRAME_MORE + ZFRAME_REUSE);
kvmsg_send (kvmsg, kvroute->socket);
}
return 0;
}

// ---------------------------------------------------------------------
// Collect updates from clients

static int
s_collector (zloop_t *loop, zmq_pollitem_t *poller, void *args)
{
clonesrv_t *self = (clonesrv_t *) args;

kvmsg_t *kvmsg = kvmsg_recv (poller->socket);
if (kvmsg) {
kvmsg_set_sequence (kvmsg, ++self->sequence);
kvmsg_send (kvmsg, self->publisher);
int ttl = atoi (kvmsg_get_prop (kvmsg, "ttl"));
if (ttl)
kvmsg_set_prop (kvmsg, "ttl",
"%" PRId64, zclock_time () + ttl * 1000);
kvmsg_store (&kvmsg, self->kvmap);
zclock_log ("I: publishing update=%d", (int) self->sequence);
}
return 0;
}

// ---------------------------------------------------------------------
// Purge ephemeral values that have expired

static int s_flush_single (char *key, void *data, void *args);

static int
s_flush_ttl (zloop_t *loop, zmq_pollitem_t *poller, void *args)
{
clonesrv_t *self = (clonesrv_t *) args;
zhash_foreach (self->kvmap, s_flush_single, args);
return 0;
}

// If key-value pair has expired, delete it and publish the
// fact to listening clients.
static int
s_flush_single (char *key, void *data, void *args)
{
clonesrv_t *self = (clonesrv_t *) args;

kvmsg_t *kvmsg = (kvmsg_t *) data;
int64_t ttl;
sscanf (kvmsg_get_prop (kvmsg, "ttl"), "%" PRId64, &ttl);
if (ttl && zclock_time () >= ttl) {
kvmsg_set_sequence (kvmsg, ++self->sequence);
kvmsg_set_body (kvmsg, (byte *) "", 0);
kvmsg_send (kvmsg, self->publisher);
kvmsg_store (&kvmsg, self->kvmap);
zclock_log ("I: publishing delete=%d", (int) self->sequence);
}
return 0;
}

Python | Ada | Basic | C++ | C# | Clojure | CL | Erlang | F# | Go | Haskell | Haxe | Java | Lua | Node.js | Objective-C | ooc | Perl | PHP | Ruby | Scala

Clone Server Reliability

top prev next

클론 모델 1.5는 상대적으로 간단합니다. 우리는 지금 불행히도 복잡한 영역에 들어갈 것입니다. 복잡한 영역으로 들어가기 전에 "우리는 실제로 이것이 필요합니까?"라고 당신은 항상 물어볼 필요가 있을만큼 안정적인 메시지를 만드는 것은 복잡합니다. 당신이 신뢰성을 해결할 수 있다면, 당신은 비용과 복잡성 측면에서 큰 승리를 얻을 수 있습니다. 물론, 당신은 때때로 일부 데이터가 손실될 수 있습니다. 그것은 좋은 교환조건 입니다.

백업 서버는 클라이언트 역할을 할수 있고, 모든 클라이언트가 하는것 처럼 업데이트를 수신하여 동기의 상태를 유지할 수 있습니다. 또한 클라이언트의 새로운 업데이트를 합니다. 아직은 hash table에 이들을 저장할 수 없습니다, 그러나 잠시 동안 그것을 붙잡아 둘수 있습니다.

우리가 처리해야 할 실패 목록을 봅시다. :

복제 서버 프로세스가 충돌하면 자동 또는 수동으로 다시 시작됩니다. 이 프로세스는 가지고 있던 상태를 잃고 어떠한 한 지점으로 되돌려야 합니다.

복제 서버 시스템이 죽고, 상당한 시간 동안 off-line됩니다. Clients는 어딘가 다른 서버로 전환해야합니다.

복제 서버 프로세스 또는 시스템이 네트워크에서 연결이 끊깁니다. 예: 스위치는 죽는다. 네트워크 언젠가 복구되겠지만, 그 동안에 Clients는 대체 서버가 필요합니다.

우리의 첫 번째 단계는 두 번째 서버를 추가하는 것입니다. 우리는 기본 및 백업을 정리했던 4장에서 이진 스타 패턴(the Binary Star pattern)을 사용할 수 있습니다. Binary Star 는 reactor 이기 때문에 이미 마지막 서버 모델을 reactor style로 리펙토링(refactoring)했던 것이 유용하게 쓰일 것입니다.

우리는 주 서버가 충돌하는 경우 업데이트가 손실되지 않도록 보장할 필요가 있습니다. 가장 간단한 기술은 두 서버에 업데이트들을 전송하는 것입니다.

백업 서버는 클라이언트 역할을 할수 있고, 모든 클라이언트가 하는것 처럼 업데이트를 수신하여 동기의 상태를 유지할 수 있습니다. 또한 클라이언트의 새로운 업데이트도 합니다. 아직은 hash table에 이들을 저장할 수 없지만, 잠시 동안 붙잡아 둘수 있습니다.

그래서, Model6는 Model5를 통해 이러한 변경 사항을 소개합니다. :

우리는 클라이언트 업데이트(서버)를 위해서 push-pull flow 대신에 pub-sub flow을 사용합니다. 그 이유는 더이상의 수신자가 없다면 push소켓이 차단되고 round-robin이 됩니다. 그래서 그들 둘을 open할 필요가 있습니다. 우리는 서버의 SUB소켓들과 연결하고, 그들에게 클라이언트의 PUB 소켓을 연결합니다. 이것은 하나의 클라이언트에서 두 서버로 fan-out하는 것을 유념하십시오.

우리는 주 서버가 죽었 때 클라이언트가 검색할 수 있도록 서버 업데이트(클라이언트)에 heartbeats를 추가합니다. 그런 다음 백업 서버로 전환할 수 있습니다.

우리는 the Binary Star bstar reactor 클래스를 사용하여 두 서버를 연결합니다. Binary Star는 "master"라고 생각하는 서버에 요청을 하는 방법으로 투표하기 위해 클라이언트에게 의존합니다. 우리는 이것을 위해서 스냅샷 요청을 사용합니다.

우리는 UUID 필드를 추가하여 모든 메시지를 유일한 ID로 업데이트 합니다. 클라이언트는 이것을 생성하고, 서버가 re-published 업데이트시에 그것을 다시 전파합니다.

슬레이브 서버는 아직 마스터 서버가 아닌, 클라이언트에서 받은 업데이트의 "pending list""를 유지합니다. 또는, 아직 클라이언트가 아닌, 마스터로부터 받은 업데이트입니다. 이 리스트는 가장 오래된것부터 최신까지의 명령이기 때문에 처음부터 업데이트를 제거하는 것은 간단한 일입니다.

유한 상태 머신으로 클라이언트 로직을 설계하는 것은 유용합니다. 클라이언트 주기 :

클라이언트가 오픈하고 그 소켓을 연결하고, 다음 첫 번째 서버에서 스냅샷을 요청합니다. 요청 쇄도를 피하기 위해, 두 번만 다른 서버에 요청합니다. 한 번의 요청으로 원하는 결과를 얻지 못했다면, 운이 나쁜 케이스일 뿐입니다. 하지만 두 번씩 요청했음에도 불구하고 결과를 얻지 못한 것은, 부주의 때문입니다.

클라이언트가 스냅샷을 받게 되었을때, 이것은 프로세스 업데이트를 기다립니다. 다시 말하지만, 그것이 일부 초과 시간 안에 서버에서 아무런 응답하지 않은 경우, 그것은 다음 서버로 fail-over 됩니다.

클라이언트가 스냅샷을 받게 되었을때, 이것은 프로세스 업데이트를 기다립니다. 다시 말하지만, 그것이 일부 초과 시간 안에 서버에서 아무런 응답하지 않은 경우, 그것은 다음 서버로 fail-over 됩니다.

클라이언트 루프는 영원합니다. 그것은 startup과 일부 클라이언트가 백업 서버와 연결하려고 시도하는 동안, 일부 클라이언트가 주 서버에 접속하려고 할 때 발생하는 fail-over시에 연관이 있습니다. Binary Star pattern은 희망차고, 정확하게, 이것을 처리합니다. (이 같은 디자인을 만드는 즐거움은 우리가 그들이 옳다는 증명할 수 없지만, 우리는 그들이 틀렸다는 것은 증명할 수 있다는 것입니다.)

우리는 클라이언트 유한 상태 시스템(finite state machine)을 설계 할 수 있습니다. :

Fail-over는 다음과 같이 발생합니다. :

클라이언트는 주서버가 더 이상 heartbeats 전송하지 않는 것, 죽은 것을 감지합니다. 클라이언트는 백업 서버에 연결하여 새 상태 스냅샷을 요청합니다.

백업 서버는 클라이언트로부터 스냅샷 요청을 수신하기 시작하며, 주 서버가 죽은 것을 감지하고, 주서버로 전환합니다.

백업 서버는 자체 해시 테이블에 대기중인 목록을 적용하고, 다음 상태 스냅샷 요청을 처리하기 시작합니다

주 서버가 다시 온라인 상태가 되면, 아래 작업이 이루어 질 것입니다. :

슬레이브 서버로서 시작하고, 클론 클라이언트로 백업 서버에 연결합니다.

클라이언트에서 SUB 소켓을 통해 업데이트를 받기 시작합니다.

우리는 몇 가지 가정을 합니다 :

하나 이상의 서버가 계속 실행됩니다 두 서버가 충돌하는 경우, 우리는 모든 서버 상태를 잃게되고 그것을 복구할 수있는 방법은 없습니다.

여러 클라이언트가 동시에 동일한 해시 키를 업데이트하지 않습니다. 클라이언트 업데이트는 다른 순서로 두 서버에 도달할 것입니다. 그래서, 백업 서버는 주 서버보다 다른 순서로 보류 목록에서 업데이트를 적용할 수 있습니다. 하나의 클라이언트에서 업데이트는 항상 두 서버에서 동일한 순서로 도달되며, 안전 합니다.

이것은 Binary Star pattern을 사용한 우리의 고가용성 서버입니다. :

이것은 구축 첫 단계로써, 우리는 재사용 가능한 클래스로써 클라이언트를 refactoring할 것입니다. 이것은 즐거움(ØMQ로 비동기 클래스를 작성하는 것는 아름다운 실습과 같습니다)의 일부이지만, 주로 우리는 복제가 임의의 응용 프로그램에 플러그인을 정말 쉽게 되기를 원하기 때문입니다. 탄력성이 올바르게 동작하는 클라이언트에 의존한 이래로, 재사용 가능한 클라이언트 API가 있을 때 이것을 보장하는 것은 훨씬 쉬워졌습니다. 우리는 클라이언트내에서 fail-over를 처리하기 시작하면, 그것은 (클론 클라이언트와 Freelance 클라이언트를 혼합된 것을 상상해보라) 조금 복잡해 집니다.

내 평소 디자인 방식은 정확하다고 판단되는 API를 첫번째로 설계하는 것이고, 다음 그것을 구현하는 것입니다. 그래서, 우리는 복제 클라이언트로 시작하고, 클론이라고 불리는 일부 추정 클래스 API 위에 위치시키기 위해 그것을 다시 작성합니다. 임의로 작성한 코드가 API로 된다는 것은 응용 프로그램을 합리적이고 안정적으로 추상적인 정의를 한다는 것을 의미합니다. 예를 들어, 모델5에서, 클라이언트는 소스에 하드 코딩된 끝점을 사용하여 서버에 별도의 세 가지 소켓을 열었습니다. 우리는 이 같은 세 가지 방법으로 API를 만들 수 있습니다. :

// Specify endpoints for each socket we need
clone_subscribe (clone, "tcp://localhost:5556");
clone_snapshot (clone, "tcp://localhost:5557");
clone_updates (clone, "tcp://localhost:5558");

// Times two, since we have two servers
clone_subscribe (clone, "tcp://localhost:5566");
clone_snapshot (clone, "tcp://localhost:5567");
clone_updates (clone, "tcp://localhost:5568");

그러나 이것은 말이 많고 오래가지 못합니다. 디자인의 내부 응용프로그램으로 내놓는 것은 좋은 생각이 아닙니다. 오늘, 우리는 3개의 소켓을 사용합니다. 내일은, 2개 또는 4개가 될 것입니다. 정말 복제 클래스를 사용하는 모든 응용프로그램을 변경하기를 원합니까?
소시지 공장 세부를 숨기기 위해, 우리는 이와 같이 작게 추상화 합니다. :

// Specify primary and backup servers
clone_connect (clone, "tcp://localhost:5551");
clone_connect (clone, "tcp://localhost:5561");

어떤 것은 단순화(하나의 서버가 한 끝점에 위치)의 이점을 가지고 있지만 내부 디자인에 영향을 미치고 있습니다. 우리는 지금 어떻게든 세 끝점에서 단일 끝점으로 변경해야 합니다. 한 가지 방법은 우리의 client-server 프로토콜의 " 클라이언트와 서버는 연속적으로 3개 포트를 통해 통신." 에 대한 지식을 적용하는 것입니다. 또 다른 방법은 서버에서 두 누락된 endpoints를 얻는 것입니다. 우리는 가장 간단한 방법으로 합니다. :

서버 상태 라우터 (ROUTER)는 포트 P 입니다.
서버 업데이트 publisher (PUB)는 포트 P + 1입니다.
서버 업데이트 subscriber (SUB)는 포트 P + 2입니다.

클론 클래스는 4 장에서 flcliapi 클래스와 같은 구조를 가지고 있습니다. 그것은 두 부분으로 구성되어 있습니다 :

background 스레드에서 실행되는 비동기 복제 에이전트. 에이전트는 모든 네트워크 I / O를 처리하고, 실시간으로 서버와 통신합니다. 응용 프로그램이 무엇을 하던지 문제는 없습니다.

호출자의 스레드에서 실행되는 동기 '클론' 클래스. 당신이 복제 오브젝트를 생성할 때, 자동으로 에이전트 스레드를 시작하고, 당신이 복제 오브젝트를 파괴했을 때, 그것은 에이전트 스레드를 죽입니다.

frontend 클래스는 inproc 'pipe' 소켓 의 agent 클래스와 통신합니다.. C에서, czmq 스레드 layer는 "attached thread"를 시작할 때 자동으로 이 파이프를 생성합니다. 이것은 ØMQ에서 멀티스레딩을 위한 자연스러은 패턴입니다.

ØMQ 없이는, 이런 비동기 클래스 디자인 종류는 정말 몇주간 열심히 작업해야 합니다. ØMQ로는, 하루 또는 이틀정도 작업하면 됩니다. 결과는 실제로 작동하는 복제 프로토콜의 단순화를 한 복합체입니다. 이렇게 만든 이유가 몇 가지 있습니다. 우리는 이것을 reactor로 만들 수도 있지만, 응용 프로그램에서 그것을 사용하는 것이 더 어려울 것이기 때문입니다. 그래서 API는 일부 서버에서 말하는 key-value 테이블과 비슷합니다. :

clone_t *clone_new (void);
void clone_destroy (clone_t **self_p);
void clone_connect (clone_t *self, char *address, char *service);
void clone_set (clone_t *self, char *key, char *value);
char *clone_get (clone_t *self, char *key);

클론 클라이언트의 Model6는 다음과 같습니다 :

clonecli6: Clone client, Model Six in C

Python | Ada | Basic | C++ | C# | Clojure | CL | Erlang | F# | Go | Haskell | Haxe | Java | Lua | Node.js | Objective-C | ooc | Perl | PHP | Ruby | Scala

그리고 여기는 실제 복제 클래스 구현입니다 :

clone: Clone class in C

/* =====================================================================
clone - client-side Clone Pattern class

---------------------------------------------------------------------
Copyright (c) 1991-2011 iMatix Corporation <www.imatix.com>
Copyright other contributors as noted in the AUTHORS file.

This file is part of the ZeroMQ Guide: http://zguide.zeromq.org

// If no server replies within this time, abandon request
#define GLOBAL_TIMEOUT 4000 // msecs
// Server considered dead if silent for this long
#define SERVER_TTL 5000 // msecs
// Number of servers we will talk to
#define SERVER_MAX 2

// =====================================================================
// Synchronous part, works in our application thread

// ---------------------------------------------------------------------
// Structure of our class

struct _clone_t {
zctx_t *ctx; // Our context wrapper
void *pipe; // Pipe through to clone agent
};

// This is the thread that handles our real clone class
static void clone_agent (void *args, zctx_t *ctx, void *pipe);

// ---------------------------------------------------------------------
// Constructor

clone_t *
clone_new (void)
{
clone_t
*self;

self = (clone_t *) zmalloc (sizeof (clone_t));
self->ctx = zctx_new ();
self->pipe = zthread_fork (self->ctx, clone_agent, NULL);
return self;
}

// ---------------------------------------------------------------------
// Destructor

void
clone_destroy (clone_t **self_p)
{
assert (self_p);
if (*self_p) {
clone_t *self = *self_p;
zctx_destroy (&self->ctx);
free (self);
*self_p = NULL;
}
}

// ---------------------------------------------------------------------
// Specify subtree for snapshot and updates, do before connect
// Sends [SUBTREE][subtree] to the agent

void clone_subtree (clone_t *self, char *subtree)
{
assert (self);
zmsg_t *msg = zmsg_new ();
zmsg_addstr (msg, "SUBTREE");
zmsg_addstr (msg, subtree);
zmsg_send (&msg, self->pipe);
}

// ---------------------------------------------------------------------
// Connect to new server endpoint
// Sends [CONNECT][endpoint][service] to the agent

void
clone_connect (clone_t *self, char *address, char *service)
{
assert (self);
zmsg_t *msg = zmsg_new ();
zmsg_addstr (msg, "CONNECT");
zmsg_addstr (msg, address);
zmsg_addstr (msg, service);
zmsg_send (&msg, self->pipe);
}

// ---------------------------------------------------------------------
// Set new value in distributed hash table
// Sends [SET][key][value][ttl] to the agent

void
clone_set (clone_t *self, char *key, char *value, int ttl)
{
char ttlstr [10];
sprintf (ttlstr, "%d", ttl);

assert (self);
zmsg_t *msg = zmsg_new ();
zmsg_addstr (msg, "SET");
zmsg_addstr (msg, key);
zmsg_addstr (msg, value);
zmsg_addstr (msg, ttlstr);
zmsg_send (&msg, self->pipe);
}

// ---------------------------------------------------------------------
// Lookup value in distributed hash table
// Sends [GET][key] to the agent and waits for a value response
// If there is no clone available, will eventually return NULL.

char *
clone_get (clone_t *self, char *key)
{
assert (self);
assert (key);
zmsg_t *msg = zmsg_new ();
zmsg_addstr (msg, "GET");
zmsg_addstr (msg, key);
zmsg_send (&msg, self->pipe);

zmsg_t *reply = zmsg_recv (self->pipe);
if (reply) {
char *value = zmsg_popstr (reply);
zmsg_destroy (&reply);
return value;
}
return NULL;
}

// =====================================================================
// Asynchronous part, works in the background

// ---------------------------------------------------------------------
// Simple class for one server we talk to

typedef struct {
char *address; // Server address
int port; // Server port
void *snapshot; // Snapshot socket
void *subscriber; // Incoming updates
uint64_t expiry; // When server expires
uint requests; // How many snapshot requests made?
} server_t;

static server_t *
server_new (zctx_t *ctx, char *address, int port, char *subtree)
{
server_t *self = (server_t *) zmalloc (sizeof (server_t));

zclock_log ("I: adding server %s:%d…", address, port);
self->address = strdup (address);
self->port = port;

self->snapshot = zsocket_new (ctx, ZMQ_DEALER);
zsocket_connect (self->snapshot, "%s:%d", address, port);
self->subscriber = zsocket_new (ctx, ZMQ_SUB);
zsocket_connect (self->subscriber, "%s:%d", address, port + 1);
zsockopt_set_subscribe (self->subscriber, subtree);
return self;
}

static void
server_destroy (server_t **self_p)
{
assert (self_p);
if (*self_p) {
server_t *self = *self_p;
free (self->address);
free (self);
*self_p = NULL;
}
}

// ---------------------------------------------------------------------
// Our agent class

// States we can be in
#define STATE_INITIAL 0 // Before asking server for state
#define STATE_SYNCING 1 // Getting state from server
#define STATE_ACTIVE 2 // Getting new updates from server

typedef struct {
zctx_t *ctx; // Context wrapper
void *pipe; // Pipe back to application
zhash_t *kvmap; // Actual key/value table
char *subtree; // Subtree specification, if any
server_t *server [SERVER_MAX];
uint nbr_servers; // 0 to SERVER_MAX
uint state; // Current state
uint cur_server; // If active, server 0 or 1
int64_t sequence; // Last kvmsg processed
void *publisher; // Outgoing updates
} agent_t;

static agent_t *
agent_new (zctx_t *ctx, void *pipe)
{
agent_t *self = (agent_t *) zmalloc (sizeof (agent_t));
self->ctx = ctx;
self->pipe = pipe;
self->kvmap = zhash_new ();
self->subtree = strdup ("");
self->state = STATE_INITIAL;
self->publisher = zsocket_new (self->ctx, ZMQ_PUB);
return self;
}

static void
agent_destroy (agent_t **self_p)
{
assert (self_p);
if (*self_p) {
agent_t *self = *self_p;
int server_nbr;
for (server_nbr = 0; server_nbr < self->nbr_servers; server_nbr++)
server_destroy (&self->server [server_nbr]);
zhash_destroy (&self->kvmap);
free (self->subtree);
free (self);
*self_p = NULL;
}
}

// Returns -1 if thread was interrupted
static int
agent_control_message (agent_t *self)
{
zmsg_t *msg = zmsg_recv (self->pipe);
char *command = zmsg_popstr (msg);
if (command == NULL)
return -1;

if (streq (command, "SUBTREE")) {
free (self->subtree);
self->subtree = zmsg_popstr (msg);
}
else
if (streq (command, "CONNECT")) {
char *address = zmsg_popstr (msg);
char *service = zmsg_popstr (msg);
if (self->nbr_servers < SERVER_MAX) {
self->server [self->nbr_servers++] = server_new (
self->ctx, address, atoi (service), self->subtree);
// We broadcast updates to all known servers
zsocket_connect (self->publisher, "%s:%d",
address, atoi (service) + 2);
}
else
zclock_log ("E: too many servers (max. %d)", SERVER_MAX);
free (address);
free (service);
}
else
if (streq (command, "SET")) {
char *key = zmsg_popstr (msg);
char *value = zmsg_popstr (msg);
char *ttl = zmsg_popstr (msg);
zhash_update (self->kvmap, key, (byte *) value);
zhash_freefn (self->kvmap, key, free);

// Send key-value pair on to server
kvmsg_t *kvmsg = kvmsg_new (0);
kvmsg_set_key (kvmsg, key);
kvmsg_set_uuid (kvmsg);
kvmsg_fmt_body (kvmsg, "%s", value);
kvmsg_set_prop (kvmsg, "ttl", ttl);
kvmsg_send (kvmsg, self->publisher);
kvmsg_destroy (&kvmsg);
puts (key);
free (ttl);
free (key); // Value is owned by hash table
}
else
if (streq (command, "GET")) {
char *key = zmsg_popstr (msg);
char *value = zhash_lookup (self->kvmap, key);
if (value)
zstr_send (self->pipe, value);
else
zstr_send (self->pipe, "");
free (key);
free (value);
}
free (command);
zmsg_destroy (&msg);
return 0;
}

// ---------------------------------------------------------------------
// Asynchronous agent manages server pool and handles request/reply
// dialog when the application asks for it.

static void
clone_agent (void *args, zctx_t *ctx, void *pipe)
{
agent_t *self = agent_new (ctx, pipe);

while (TRUE) {
zmq_pollitem_t poll_set [] = {
{ pipe, 0, ZMQ_POLLIN, 0 },
{ 0, 0, ZMQ_POLLIN, 0 }
};
int poll_timer = -1;
int poll_size = 2;
server_t *server = self->server [self->cur_server];
switch (self->state) {
case STATE_INITIAL:
// In this state we ask the server for a snapshot,
// if we have a server to talk to…
if (self->nbr_servers > 0) {
zclock_log ("I: waiting for server at %s:%d…",
server->address, server->port);
if (server->requests < 2) {
zstr_sendm (server->snapshot, "ICANHAZ?");
zstr_send (server->snapshot, self->subtree);
server->requests++;
}
server->expiry = zclock_time () + SERVER_TTL;
self->state = STATE_SYNCING;
poll_set [1].socket = server->snapshot;
}
else
poll_size = 1;
break;
case STATE_SYNCING:
// In this state we read from snapshot and we expect
// the server to respond, else we fail over.
poll_set [1].socket = server->snapshot;
break;
case STATE_ACTIVE:
// In this state we read from subscriber and we expect
// the server to give hugz, else we fail over.
poll_set [1].socket = server->subscriber;
break;
}
if (server) {
poll_timer = (server->expiry - zclock_time ())
* ZMQ_POLL_MSEC;
if (poll_timer < 0)
poll_timer = 0;
}
// ------------------------------------------------------------
// Poll loop
int rc = zmq_poll (poll_set, poll_size, poll_timer);
if (rc == -1)
break; // Context has been shut down

if (poll_set [0].revents & ZMQ_POLLIN) {
if (agent_control_message (self))
break; // Interrupted
}
else
if (poll_set [1].revents & ZMQ_POLLIN) {
kvmsg_t *kvmsg = kvmsg_recv (poll_set [1].socket);
if (!kvmsg)
break; // Interrupted

// Anything from server resets its expiry time
server->expiry = zclock_time () + SERVER_TTL;
if (self->state == STATE_SYNCING) {
// Store in snapshot until we're finished
server->requests = 0;
if (streq (kvmsg_key (kvmsg), "KTHXBAI")) {
self->sequence = kvmsg_sequence (kvmsg);
self->state = STATE_ACTIVE;
zclock_log ("I: received from %s:%d snapshot=%d",
server->address, server->port,
(int) self->sequence);
kvmsg_destroy (&kvmsg);
}
else
kvmsg_store (&kvmsg, self->kvmap);
}
else
if (self->state == STATE_ACTIVE) {
// Discard out-of-sequence updates, incl. hugz
if (kvmsg_sequence (kvmsg) > self->sequence) {
self->sequence = kvmsg_sequence (kvmsg);
kvmsg_store (&kvmsg, self->kvmap);
zclock_log ("I: received from %s:%d update=%d",
server->address, server->port,
(int) self->sequence);
}
else
kvmsg_destroy (&kvmsg);
}
}
else {
// Server has died, failover to next
zclock_log ("I: server at %s:%d didn't give hugz",
server->address, server->port);
self->cur_server = (self->cur_server + 1) % self->nbr_servers;
self->state = STATE_INITIAL;
}
}
agent_destroy (&self);
}

Python | Ada | Basic | C++ | C# | Clojure | CL | Erlang | F# | Go | Haskell | Haxe | Java | Lua | Node.js | Objective-C | ooc | Perl | PHP | Ruby | Scala

마지막으로, 여기에 복제 서버의 여섯 번째이자 마지막 모델입니다 :

clonesrv6: Clone server, Model Six in C

//
// Clone server Model Six
//

// Lets us build this source without creating a library
#include "bstar.c"
#include "kvmsg.c"

// Bstar reactor handlers
static int s_snapshots (zloop_t *loop, zmq_pollitem_t *poller, void *args);
static int s_collector (zloop_t *loop, zmq_pollitem_t *poller, void *args);
static int s_flush_ttl (zloop_t *loop, zmq_pollitem_t *poller, void *args);
static int s_send_hugz (zloop_t *loop, zmq_pollitem_t *poller, void *args);
static int s_new_master (zloop_t *loop, zmq_pollitem_t *poller, void *args);
static int s_new_slave (zloop_t *loop, zmq_pollitem_t *poller, void *args);
static int s_subscriber (zloop_t *loop, zmq_pollitem_t *poller, void *args);

// Our server is defined by these properties
typedef struct {
zctx_t *ctx; // Context wrapper
zhash_t *kvmap; // Key-value store
bstar_t *bstar; // Bstar reactor core
int64_t sequence; // How many updates we're at
int port; // Main port we're working on
int peer; // Main port of our peer
void *publisher; // Publish updates and hugz
void *collector; // Collect updates from clients
void *subscriber; // Get updates from peer
zlist_t *pending; // Pending updates from clients
Bool primary; // TRUE if we're primary
Bool master; // TRUE if we're master
Bool slave; // TRUE if we're slave
} clonesrv_t;

int main (int argc, char *argv [])
{
clonesrv_t *self = (clonesrv_t *) zmalloc (sizeof (clonesrv_t));
if (argc == 2 && streq (argv [1], "-p")) {
zclock_log ("I: primary master, waiting for backup (slave)");
self->bstar = bstar_new (BSTAR_PRIMARY, "tcp://*:5003",
"tcp://localhost:5004");
bstar_voter (self->bstar, "tcp://*:5556", ZMQ_ROUTER, s_snapshots, self);
self->port = 5556;
self->peer = 5566;
self->primary = TRUE;
}
else
if (argc == 2 && streq (argv [1], "-b")) {
zclock_log ("I: backup slave, waiting for primary (master)");
self->bstar = bstar_new (BSTAR_BACKUP, "tcp://*:5004",
"tcp://localhost:5003");
bstar_voter (self->bstar, "tcp://*:5566", ZMQ_ROUTER, s_snapshots, self);
self->port = 5566;
self->peer = 5556;
self->primary = FALSE;
}
else {
printf ("Usage: clonesrv4 { -p | -b }\n");
free (self);
exit (0);
}
// Primary server will become first master
if (self->primary)
self->kvmap = zhash_new ();

self->ctx = zctx_new ();
self->pending = zlist_new ();
bstar_set_verbose (self->bstar, TRUE);

// Set up our clone server sockets
self->publisher = zsocket_new (self->ctx, ZMQ_PUB);
self->collector = zsocket_new (self->ctx, ZMQ_SUB);
zsocket_bind (self->publisher, "tcp://*:%d", self->port + 1);
zsocket_bind (self->collector, "tcp://*:%d", self->port + 2);

// Set up our own clone client interface to peer
self->subscriber = zsocket_new (self->ctx, ZMQ_SUB);
zsocket_connect (self->subscriber, "tcp://localhost:%d", self->peer + 1);

// Register state change handlers
bstar_new_master (self->bstar, s_new_master, self);
bstar_new_slave (self->bstar, s_new_slave, self);

// Register our other handlers with the bstar reactor
zmq_pollitem_t poller = { self->collector, 0, ZMQ_POLLIN };
zloop_poller (bstar_zloop (self->bstar), &poller, s_collector, self);
zloop_timer (bstar_zloop (self->bstar), 1000, 0, s_flush_ttl, self);
zloop_timer (bstar_zloop (self->bstar), 1000, 0, s_send_hugz, self);

// Start the Bstar reactor
bstar_start (self->bstar);

// Interrupted, so shut down
while (zlist_size (self->pending)) {
kvmsg_t *kvmsg = (kvmsg_t *) zlist_pop (self->pending);
kvmsg_destroy (&kvmsg);
}
zlist_destroy (&self->pending);
bstar_destroy (&self->bstar);
zhash_destroy (&self->kvmap);
zctx_destroy (&self->ctx);
free (self);

return 0;
}

// ---------------------------------------------------------------------
// Send snapshots to clients who ask for them

static int s_send_single (char *key, void *data, void *args);

static int
s_snapshots (zloop_t *loop, zmq_pollitem_t *poller, void *args)
{
clonesrv_t *self = (clonesrv_t *) args;

if (subtree) {
// Send state socket to client
kvroute_t routing = { poller->socket, identity, subtree };
zhash_foreach (self->kvmap, s_send_single, &routing);

// Send one state snapshot key-value pair to a socket
// Hash item data is our kvmsg object, ready to send
static int
s_send_single (char *key, void *data, void *args)
{
kvroute_t *kvroute = (kvroute_t *) args;
kvmsg_t *kvmsg = (kvmsg_t *) data;
if (strlen (kvroute->subtree) <= strlen (kvmsg_key (kvmsg))
&& memcmp (kvroute->subtree,
kvmsg_key (kvmsg), strlen (kvroute->subtree)) == 0) {
// Send identity of recipient first
zframe_send (&kvroute->identity,
kvroute->socket, ZFRAME_MORE + ZFRAME_REUSE);
kvmsg_send (kvmsg, kvroute->socket);
}
return 0;
}

// ---------------------------------------------------------------------
// Collect updates from clients
// If we're master, we apply these to the kvmap
// If we're slave, or unsure, we queue them on our pending list

static int s_was_pending (clonesrv_t *self, kvmsg_t *kvmsg);

static int
s_collector (zloop_t *loop, zmq_pollitem_t *poller, void *args)
{
clonesrv_t *self = (clonesrv_t *) args;

kvmsg_t *kvmsg = kvmsg_recv (poller->socket);
kvmsg_dump (kvmsg);
if (kvmsg) {
if (self->master) {
kvmsg_set_sequence (kvmsg, ++self->sequence);
kvmsg_send (kvmsg, self->publisher);
int ttl = atoi (kvmsg_get_prop (kvmsg, "ttl"));
if (ttl)
kvmsg_set_prop (kvmsg, "ttl",
"%" PRId64, zclock_time () + ttl * 1000);
kvmsg_store (&kvmsg, self->kvmap);
zclock_log ("I: publishing update=%d", (int) self->sequence);
}
else {
// If we already got message from master, drop it, else
// hold on pending list
if (s_was_pending (self, kvmsg))
kvmsg_destroy (&kvmsg);
else
zlist_append (self->pending, kvmsg);
}
}
return 0;
}

// If message was already on pending list, remove it and
// return TRUE, else return FALSE.

static int
s_was_pending (clonesrv_t *self, kvmsg_t *kvmsg)
{
kvmsg_t *held = (kvmsg_t *) zlist_first (self->pending);
while (held) {
if (memcmp (kvmsg_uuid (kvmsg),
kvmsg_uuid (held), sizeof (uuid_t)) == 0) {
zlist_remove (self->pending, held);
return TRUE;
}
held = (kvmsg_t *) zlist_next (self->pending);
}
return FALSE;
}

// ---------------------------------------------------------------------
// Purge ephemeral values that have expired

static int s_flush_single (char *key, void *data, void *args);

static int
s_flush_ttl (zloop_t *loop, zmq_pollitem_t *poller, void *args)
{
clonesrv_t *self = (clonesrv_t *) args;
if (self->kvmap)
zhash_foreach (self->kvmap, s_flush_single, args);
return 0;
}

// If key-value pair has expired, delete it and publish the
// fact to listening clients.
static int
s_flush_single (char *key, void *data, void *args)
{
clonesrv_t *self = (clonesrv_t *) args;

// ---------------------------------------------------------------------
// Send hugz to anyone listening on the publisher socket

static int
s_send_hugz (zloop_t *loop, zmq_pollitem_t *poller, void *args)
{
clonesrv_t *self = (clonesrv_t *) args;

kvmsg_t *kvmsg = kvmsg_new (self->sequence);
kvmsg_set_key (kvmsg, "HUGZ");
kvmsg_set_body (kvmsg, (byte *) "", 0);
kvmsg_send (kvmsg, self->publisher);
kvmsg_destroy (&kvmsg);

return 0;
}

// ---------------------------------------------------------------------
// State change handlers
// We're becoming master
//
// The backup server applies its pending list to its own hash table,
// and then starts to process state snapshot requests.

static int
s_new_master (zloop_t *loop, zmq_pollitem_t *unused, void *args)
{
clonesrv_t *self = (clonesrv_t *) args;

self->master = TRUE;
self->slave = FALSE;
zmq_pollitem_t poller = { self->subscriber, 0, ZMQ_POLLIN };
zloop_poller_end (bstar_zloop (self->bstar), &poller);

// Apply pending list to own hash table
while (zlist_size (self->pending)) {
kvmsg_t *kvmsg = (kvmsg_t *) zlist_pop (self->pending);
kvmsg_set_sequence (kvmsg, ++self->sequence);
kvmsg_send (kvmsg, self->publisher);
kvmsg_store (&kvmsg, self->kvmap);
zclock_log ("I: publishing pending=%d", (int) self->sequence);
}
return 0;
}

// ---------------------------------------------------------------------
// We're becoming slave

static int
s_new_slave (zloop_t *loop, zmq_pollitem_t *unused, void *args)
{
clonesrv_t *self = (clonesrv_t *) args;

zhash_destroy (&self->kvmap);
self->master = FALSE;
self->slave = TRUE;
zmq_pollitem_t poller = { self->subscriber, 0, ZMQ_POLLIN };
zloop_poller (bstar_zloop (self->bstar), &poller, s_subscriber, self);

return 0;
}

// ---------------------------------------------------------------------
// Collect updates from peer (master)
// We're always slave when we get these updates

static int
s_subscriber (zloop_t *loop, zmq_pollitem_t *poller, void *args)
{
clonesrv_t *self = (clonesrv_t *) args;
// Get state snapshot if necessary
if (self->kvmap == NULL) {
self->kvmap = zhash_new ();
void *snapshot = zsocket_new (self->ctx, ZMQ_DEALER);
zsocket_connect (snapshot, "tcp://localhost:%d", self->peer);
zclock_log ("I: asking for snapshot from: tcp://localhost:%d",
self->peer);
zstr_send (snapshot, "ICANHAZ?");
while (TRUE) {
kvmsg_t *kvmsg = kvmsg_recv (snapshot);
if (!kvmsg)
break; // Interrupted
if (streq (kvmsg_key (kvmsg), "KTHXBAI")) {
self->sequence = kvmsg_sequence (kvmsg);
kvmsg_destroy (&kvmsg);
break; // Done
}
kvmsg_store (&kvmsg, self->kvmap);
}
zclock_log ("I: received snapshot=%d", (int) self->sequence);
zsocket_destroy (self->ctx, snapshot);
}
// Find and remove update off pending list
kvmsg_t *kvmsg = kvmsg_recv (poller->socket);
if (!kvmsg)
return 0;

if (strneq (kvmsg_key (kvmsg), "HUGZ")) {
if (!s_was_pending (self, kvmsg)) {
// If master update came before client update, flip it
// around, store master update (with sequence) on pending
// list and use to clear client update when it comes later
zlist_append (self->pending, kvmsg_dup (kvmsg));
}
// If update is more recent than our kvmap, apply it
if (kvmsg_sequence (kvmsg) > self->sequence) {
self->sequence = kvmsg_sequence (kvmsg);
kvmsg_store (&kvmsg, self->kvmap);
zclock_log ("I: received update=%d", (int) self->sequence);
}
else
kvmsg_destroy (&kvmsg);
}
else
kvmsg_destroy (&kvmsg);

return 0;
}

Python | Ada | Basic | C++ | C# | Clojure | CL | Erlang | F# | Go | Haskell | Haxe | Java | Lua | Node.js | Objective-C | ooc | Perl | PHP | Ruby | Scala

이 메인 프로그램은 코드가 단지 몇 백 라인이지만, 작동하는데 시간이 좀 걸립니다. 정확하게 , Model6를 구축하는 것은 어려운 일 이었고, 작업에 한주 전채가 "사랑하는 하나님, 이 가이드는 너무 복잡합니다." 걸렸습니다. 우리는 이 작은 응용프로그램으로 거의 모든 것을 만들었습니다. failover, ephemeral values, subtrees 등등. 초기 디자인이 매우 정확하게 되었다는 것이 나를 깜작 놀라게 하였습니다. 그러나 너무 많은 소켓 흐름을 상세하게 작성하고 디버깅하는 것은 특별한 일입니다. 내가 이 작품을 만든 방법은 다음과 같습니다.

코드에서 많은 지루한 작업을 제거하고, 나머지는 더 단순하고 확실하게 남기도록 reactors (bstar, on top of zloop) 사용했습니다. 전체 서버는 하나의 스레드로 작동되므로, 스레드 사이의 이상한 작동하는 것은 없습니다. 단지 행복하게 자신의 일을 할 수있는 모든 핸들러 주위에 구조 포인터('self') 를 전달합니다. reactors 를 사용하는 한 좋은 부작용은 덜 밀접하게 poll loop에 통합된 코드이며, 재사용이 훨씬 용이합니다. Model6의 큰 덩어리는 Model5에서 가져옵니다.

그것을 조금씩 빌드함으로써, 각 조각들을 얻을 수 있었고 이는 다음 작업 전에 제대로 작동하는지 알 수 있게 해주었습니다. 4 or 5개의 소켓 플로우가 있는 것은, 꽤 많은 디버깅 및 테스트를 했다는 것을 의미 합니다. 나는 콘솔의 프린트 자료로 디버그 합니다. (예 : dumping messages). 실제로 이런 작업을 위해 디버거를 여는 것은 아무 의미가 없습니다.

항상 Valgrind에서 시험하기때문에, memory leaks이 없을 것입니다. C에서는 이것이 주요 관심사지만, 당신은 어떤 garbage collector를 할당할 수 없습니다. kvmsg 및 czmq 같은 적절하고 일관된 추상적 개념을 사용하면 매우 도움이 됩니다.

코드에 여전히 결함이 있어, 어떤 독자들은 이것을 위해 디버깅과 수정하는데 주말을 보낼 것이라고 확신합니다. 실제 응용프로그램을 위하여 기초로 사용하는 이 모델만으로도 충분합니다.

여섯 번째 모델을 테스트하기위해서 임의의 순서로 기본 서버와 백업 서버와 클라이언트를 시작합니다. 그리고 임의로 서버중 하나를 죽이고 재 시작하고, 이일을 게속하도록 유지합니다. 디자인과 코드가 정확한 경우, 클라이언트는 master서버가 어떤 것이든 간에 업데이트의 동일한 스트림을 얻는 것을 유지해 갈 것입니다.

Clone Protocol Specification

top prev next

신뢰할 수있는 pub-sub을 구축하기 위해 이런 많은 작업 후, 우리는 개발하기 위해서 안전하게 응용프로그램을 구축할 수있게 몇 가지 보장을 원합니다. 좋은 시작은 프로토콜을 작성하는 것입니다. 이것은 우리가 다른 언어로 구현하게 하고, 우리는 코드에 깊이 손을 대는 것보다 종이에 디자인을 향상시켜야 합니다.

그 다음, 여기에 Clustered Hashmap Protocol이 있습니다, “cluster-wide key-value hashmap을 정의하고 클라이언트 집합에 걸쳐 이것을 공유하기 위한 메커니즘 입니다. CHP는 클라인언트가 hashmap의 subtrees와 함께 작동하고, 값을 업데이트하고, 임시값을 정의하도록 허용합니다.”

http://rfc.zeromq.org/spec:12

(More coming soon…)